Преобразуйте время RFC 3339 в стандартную временную метку Python
Вопрос
Есть ли простой способ преобразовать RFC 3339 время в обычную временную метку Python?
У меня есть скрипт, который считывает ленту ATOM, и я хотел бы иметь возможность сравнивать временную метку элемента в ленте ATOM со временем модификации файла.
Я замечаю, что из Спецификация АТОМА, что даты АТОМА включают смещение часового пояса (Z<a number>
) но, в моем случае, после Z
так что, я думаю, мы можем предположить время по Гринвичу.
Я полагаю, я мог бы проанализировать время с помощью какого-нибудь регулярного выражения, но я надеялся, что в Python есть встроенный способ сделать это, который я просто не смог найти.
Решение
Нет встроенного, афаик.
фид.дата.rfc3339Это модуль библиотеки Python с функциями для преобразования строк временных меток в формате RFC 3339 в значения с плавающей запятой времени Python и наоборот.RFC 3339 — это формат временных меток, используемый форматом распространения каналов Atom.
Имеет лицензию BSD.
http://home.blarg.net/~steveha/pyfeed.html
(Отредактировано, чтобы было понятно, что это не я писал.:-)
Другие советы
Вы не включаете пример, но если у вас нет смещения Z или часового пояса, и если предположить, что вам нужны не длительности, а только базовое время, то, возможно, это вам подойдет:
import datetime as dt
>>> dt.datetime.strptime('1985-04-12T23:20:50.52', '%Y-%m-%dT%H:%M:%S.%f')
datetime.datetime(1985, 4, 12, 23, 20, 50, 520000)
Функция strptime() была добавлена в модуль datetime в Python 2.5, поэтому некоторые люди еще не знают, что она там есть.
Редактировать:Функция time.strptime() существует уже некоторое время и работает примерно так же, чтобы дать вам значение struct_time:
>>> ts = time.strptime('1985-04-12T23:20:50.52', '%Y-%m-%dT%H:%M:%S.%f')
>>> ts
time.struct_time(tm_year=1985, tm_mon=4, tm_mday=12, tm_hour=23, tm_min=20, tm_sec=50, tm_wday=4, tm_yday=102, tm_isdst=-1)
>>> time.mktime(ts)
482210450.0
http://pypi.python.org/pypi/iso8601/ кажется, может анализировать ISO 8601, подмножеством которого является RFC 3339, возможно, это может быть полезно, но, опять же, не встроено.
Я много боролся с форматом даты и времени RFC3339, но нашел подходящее решение для преобразования date_string <=> datetime_object в обоих направлениях.
Вам понадобятся два разных внешних модуля, потому что один из них способен выполнять преобразование только в одном направлении (к сожалению):
первая установка:
sudo pip install rfc3339
sudo pip install iso8601
затем включите:
import datetime # for general datetime object handling
import rfc3339 # for date object -> date string
import iso8601 # for date string -> date object
Чтобы не запоминать, какой модуль для какого направления, я написал две простые вспомогательные функции:
def get_date_object(date_string):
return iso8601.parse_date(date_string)
def get_date_string(date_object):
return rfc3339.rfc3339(date_object)
который внутри вашего кода вы можете легко использовать следующим образом:
input_string = '1989-01-01T00:18:07-05:00'
test_date = get_date_object(input_string)
# >>> datetime.datetime(1989, 1, 1, 0, 18, 7, tzinfo=<FixedOffset '-05:00' datetime.timedelta(-1, 68400)>)
test_string = get_date_string(test_date)
# >>> '1989-01-01T00:18:07-05:00'
test_string is input_string # >>> True
Эврика!Теперь вы можете легко(хаха) используйте строки даты и строки даты в удобном формате.
http://bugs.python.org/issue15873 (дубликат http://bugs.python.org/issue5207 )
Похоже, встроенной функции пока нет.
фидпарсер.py предоставляет надежный/расширяемый способ анализа различных форматов дат, которые могут встретиться в реальных Atom/RSS-каналах:
>>> from feedparser import _parse_date as parse_date
>>> parse_date('1985-04-12T23:20:50.52Z')
time.struct_time(tm_year=1985, tm_mon=4, tm_mday=12, tm_hour=23, tm_min=20,
tm_sec=50, tm_wday=4, tm_yday=102, tm_isdst=1)
Если вы используете Django, вы можете использовать функцию Django. parse_datetime
:
>>> from django.utils.dateparse import parse_datetime
>>> parse_datetime("2016-07-19T07:30:36+05:00")
datetime.datetime(2016, 7, 19, 7, 30, 36, tzinfo=<django.utils.timezone.FixedOffset object at 0x101c0c1d0>)
попробуй это, у меня отлично работает
datetime_obj = datetime.strptime("2014-01-01T00:00:00Z", '%Y-%m-%dT%H:%M:%SZ')
или
datetime_obj = datetime.strptime("Mon, 01 Jun 2015 16:41:40 GMT", '%a, %d %b %Y %H:%M:%S GMT')
Используя Python 3, вы можете использовать RegEx, чтобы разбить временную метку RFC 3339 на ее компоненты.Затем непосредственно создайте объект datetime, никаких дополнительных модулей не требуется:
import re
import datetime
def parse_rfc3339(dt):
broken = re.search(r'([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}):([0-9]{2}):([0-9]{2})(\.([0-9]+))?(Z|([+-][0-9]{2}):([0-9]{2}))', dt)
return(datetime.datetime(
year = int(broken.group(1)),
month = int(broken.group(2)),
day = int(broken.group(3)),
hour = int(broken.group(4)),
minute = int(broken.group(5)),
second = int(broken.group(6)),
microsecond = int(broken.group(8) or "0"),
tzinfo = datetime.timezone(datetime.timedelta(
hours = int(broken.group(10) or "0"),
minutes = int(broken.group(11) or "0")))))
В этом примере пропущенные часовые пояса или микросекунды обозначены как «0», но может потребоваться дополнительная проверка ошибок.Приветствую, Алекс
библиотека rfc3339: http://henry.precheur.org/python/rfc3339
Наткнулся на потрясающее dateutil.parser модуль в другом вопросе, и попробовал его для решения моей проблемы с RFC3339, и, похоже, он справляется со всем, что я ему говорю, с большим здравомыслием, чем любой другой ответ в этом вопросе.