Dateparser - маленькая, но мощная библиотека парсинга дат

Изучаем библиотеку Dateparser, которая помогает парсить даты

Библиотека Dateparser была разработана, чтобы извлекать даты из HTML-страниц. Первоначально она использовалась только разработчиками парсеров, но позже понравилась широкому сообществу разработчиков и стала использоваться повсеместно. Библиотека используется во многих приложениях, таких как инструменты командной строки, чат-боты и т. д.

Ключевые особенности Dateparser

  • Поддержка почти для всех существующих форматов дат: абсолютные даты, относительные даты ("две недели назад" или "завтра"), временные метки и т. д.
  • Поддержка более 200 языков.
  • Автообопределение языка
  • Настраиваемое поведение через настройки.
  • Поддержка негрегорских календарных систем.
  • Поддержка дат с аббревиатурами часовых поясов или смещениями UTC (14 июня 2022 г. по восточному поясному времени", "24 февраля 2022 г. 08:15 +0300"...)
  • Поиск дат в длинных текстах.

Подробнее о Dateparser на Github.

Использование Dateparser

Более 5,7 тыс. проектов в GitHub перечисляют Dateparser как зависимость. Некоторые примеры:



Согласно статистике загрузки PyPI, в прошлом месяце Dateparser был загружен 1,65 миллиона раз. Это более 2200 загрузок каждый час!


Dateparser также имеет 2,1 тыс. звезд на Github, и это число продолжает расти.

Примеры использования Dateparse

Чтобы начать использовать Dateparser необходимо импортировать его и вызвать метод `parse()`:

import dateparser

dateparser.parse('14/10/2022')
datetime.datetime(2022, 10, 14, 0, 0)

Конечно, вы можете сделать гораздо больше, чем это. Но чтобы начать использовать ее без какой-либо нудной настройки и чтения большого количества документации, достаточно этого.

Настройка

Интерфейс действительно прост, но если появляются какие-то нюансы, то справиться с ними помогут настройки. Вы можете выбрать ссылки на даты, предпочтительный порядок дат, настроить конфигурацию часового пояса, решить, как обрабатывать неполные даты и т. д.


Взгляните на документацию по настройкам, чтобы решить более сложные задачи.

Тестовое покрытие

Хороший код поставляется с автоматизированными тестами, которые обеспечивают хорошее покрытие кода. Dateparser имеет охват кода >98%, с примерами на многих языках.

Полезные ссылки

Если вы хотите узнать больше о Dateparser, библиотеке синтаксического анализа дат и о том, как использовать ее в своем проекте, ознакомьтесь с этими ссылками:


Нужен парсинг сайтов?