Как мне разобрать строку в float или int?
-
22-08-2019 - |
Вопрос
В Python, как я могу разобрать числовую строку следующим образом "545.2222"
к его соответствующему значению с плавающей точкой, 545.2222
?Или разобрать строку "31"
к целому числу, 31
?
Я просто хочу знать, как разобрать плавать str
к a float
, и (отдельно) an инт str
к одному int
.
Решение
>>> a = "545.2222"
>>> float(a)
545.22220000000004
>>> int(float(a))
545
Другие советы
def num(s):
try:
return int(s)
except ValueError:
return float(s)
Метод Python для проверки, является ли строка с плавающей точкой:
def is_float(value):
try:
float(value)
return True
except:
return False
Более длинным и точным названием для этой функции могло бы быть: is_convertible_to_float(value)
Что является и не является поплавком в Питон может вас удивить:
val is_float(val) Note
-------------------- ---------- --------------------------------
"" False Blank string
"127" True Passed string
True True Pure sweet Truth
"True" False Vile contemptible lie
False True So false it becomes true
"123.456" True Decimal
" -127 " True Spaces trimmed
"\t\n12\r\n" True whitespace ignored
"NaN" True Not a number
"NaNanananaBATMAN" False I am Batman
"-iNF" True Negative infinity
"123.E4" True Exponential notation
".1" True mantissa only
"1,234" False Commas gtfo
u'\x30' True Unicode is fine.
"NULL" False Null is not special
0x3fade True Hexadecimal
"6e7777777777777" True Shrunk to infinity
"1.797693e+308" True This is max value
"infinity" True Same as inf
"infinityandBEYOND" False Extra characters wreck it
"12.34.56" False Only one dot allowed
u'四' False Japanese '4' is not a float.
"#56" False Pound sign
"56%" False Percent of what?
"0E0" True Exponential, move dot 0 places
0**0 True 0___0 Exponentiation
"-5e-5" True Raise to a negative number
"+1e1" True Plus is OK with exponent
"+1e1^5" False Fancy exponent not interpreted
"+1e1.3" False No decimals in exponent
"-+1" False Make up your mind
"(1)" False Parenthesis is bad
Ты думаешь, что знаешь, что такое цифры?Ты не так хорош, как тебе кажется!Не большой сюрприз.
Не используйте этот код в критически важном программном обеспечении!
Перехват широких исключений таким образом, уничтожение канареек и поглощение исключения создает крошечную вероятность того, что допустимое значение с плавающей точкой в виде строки вернет false .В float(...)
ошибка строки кода может произойти по любой из тысячи причин, которые не имеют ничего общего с содержимым строки.Но если вы пишете жизненно важное программное обеспечение на языке прототипов, использующем утиный ввод, таком как Python, то у вас возникают гораздо большие проблемы.
Это еще один метод, который заслуживает того, чтобы быть упомянутым здесь, ast.буквальный_эвал:
Это может быть использовано для безопасного вычисления строк, содержащих выражения Python, из ненадежных источников без необходимости самостоятельного анализа значений.
То есть безопасная "оценка"
>>> import ast
>>> ast.literal_eval("545.2222")
545.2222
>>> ast.literal_eval("31")
31
float(x) if '.' in x else int(x)
Локализация и запятые
Вам следует рассмотреть возможность использования запятых в строковом представлении числа для таких случаев, как float("545,545.2222")
который выдает исключение.Вместо этого используйте методы в locale
чтобы преобразовать строки в числа и правильно интерпретировать запятые.В locale.atof
метод преобразуется в значение с плавающей точкой за один шаг, как только язык был установлен для желаемого соглашения о числах.
Пример 1 - Соглашения о нумерации в Соединенных Штатах
В Соединенных Штатах и Великобритании запятые могут использоваться в качестве разделителя тысяч.В этом примере с американской локализацией запятая правильно используется в качестве разделителя:
>>> import locale
>>> a = u'545,545.2222'
>>> locale.setlocale(locale.LC_ALL, 'en_US.UTF-8')
'en_US.UTF-8'
>>> locale.atof(a)
545545.2222
>>> int(locale.atof(a))
545545
>>>
Пример 2 - Европейские соглашения о нумерации
В большинство стран мира, запятые используются для десятичных знаков вместо точек.В этом примере с французской локализацией запятая правильно обрабатывается как десятичный знак:
>>> import locale
>>> b = u'545,2222'
>>> locale.setlocale(locale.LC_ALL, 'fr_FR')
'fr_FR'
>>> locale.atof(b)
545.2222
Метод locale.atoi
также доступен, но аргумент должен быть целым числом.
Если вы не испытываете отвращения к сторонним модулям, вы могли бы ознакомиться с быстрые номера модуль.Он предоставляет функцию, называемую быстро_реальный это делает именно то, о чем просит этот вопрос, и делает это быстрее, чем реализация на чистом Python:
>>> from fastnumbers import fast_real
>>> fast_real("545.2222")
545.2222
>>> type(fast_real("545.2222"))
float
>>> fast_real("31")
31
>>> type(fast_real("31"))
int
Пользователи кодлогика и харли являются правильными, но имейте в виду, если вы знаете, что строка является целым числом (например, 545), вы можете вызвать int("545") без предварительного приведения к float .
Если ваши строки находятся в списке, вы также можете использовать функцию map .
>>> x = ["545.0", "545.6", "999.2"]
>>> map(float, x)
[545.0, 545.60000000000002, 999.20000000000005]
>>>
Это хорошо только в том случае, если все они одного типа.
Вопрос кажется немного устаревшим.Но позвольте мне предложить функцию parseStr, которая делает нечто подобное, то есть возвращает integer или float, и если данная строка ASCII не может быть преобразована ни в одну из них, она возвращает ее нетронутой.Код, конечно, может быть скорректирован таким образом, чтобы делать только то, что вы хотите:
>>> import string
>>> parseStr = lambda x: x.isalpha() and x or x.isdigit() and \
... int(x) or x.isalnum() and x or \
... len(set(string.punctuation).intersection(x)) == 1 and \
... x.count('.') == 1 and float(x) or x
>>> parseStr('123')
123
>>> parseStr('123.3')
123.3
>>> parseStr('3HC1')
'3HC1'
>>> parseStr('12.e5')
1200000.0
>>> parseStr('12$5')
'12$5'
>>> parseStr('12.2.2')
'12.2.2'
В Python, как я могу разобрать числовую строку типа "545.2222" до ее соответствующего значения с плавающей запятой, 542.2222?Или разобрать строку "31" до целого числа 31? Я просто хочу знать, как преобразовать строку с плавающей точкой в float и (отдельно) строку int в int.
Хорошо, что вы просите сделать это отдельно.Если вы смешиваете их, то, возможно, создадите себе проблемы позже.Простой ответ таков:
"545.2222"
плавать:
>>> float("545.2222")
545.2222
"31"
к целому числу:
>>> int("31")
31
Другие преобразования, целые числа в строки и литералы и из них:
Конверсии из разных баз, и вы должны знать базу заранее (по умолчанию используется значение 10).Обратите внимание, что вы можете добавить к ним префикс, который Python ожидает для своих литералов (см. Ниже), или удалить префикс:
>>> int("0b11111", 2)
31
>>> int("11111", 2)
31
>>> int('0o37', 8)
31
>>> int('37', 8)
31
>>> int('0x1f', 16)
31
>>> int('1f', 16)
31
Если вы не знаете базу заранее, но вы знаете, что у них будет правильный префикс, Python может вывести это за вас, если вы передадите 0
в качестве основы:
>>> int("0b11111", 0)
31
>>> int('0o37', 0)
31
>>> int('0x1f', 0)
31
Не-десятичный (т.е.Целое число) Литералы из других базисов
Однако, если ваша мотивация заключается в том, чтобы ваш собственный код четко представлял жестко запрограммированные конкретные значения, вам может не потребоваться преобразование из базовых - вы можете позволить Python сделать это за вас автоматически с правильным синтаксисом.
Вы можете использовать соответствующие префиксы, чтобы получить автоматическое преобразование в целые числа с следующие литералы.Они действительны для Python 2 и 3:
Двоичный файл, префикс 0b
>>> 0b11111
31
Восьмеричное число, префикс 0o
>>> 0o37
31
Шестнадцатеричный, префиксный 0x
>>> 0x1f
31
Это может быть полезно при описании двоичных флагов, прав доступа к файлам в коде или шестнадцатеричных значений для цветов - например, обратите внимание на отсутствие кавычек:
>>> 0b10101 # binary flags
21
>>> 0o755 # read, write, execute perms for owner, read & ex for group & others
493
>>> 0xffffff # the color, white, max values for red, green, and blue
16777215
Создание неоднозначных окталов Python 2, совместимых с Python 3
Если вы видите целое число, начинающееся с 0, в Python 2 это (устаревший) восьмеричный синтаксис.
>>> 037
31
Это плохо, потому что похоже, что значение должно быть 37
.Итак, в Python 3 теперь он вызывает SyntaxError
:
>>> 037
File "<stdin>", line 1
037
^
SyntaxError: invalid token
Преобразуйте ваши окталы Python 2 в окталы, которые работают как во 2, так и в 3 с 0o
префикс:
>>> 0o37
31
float("545.2222")
и int(float("545.2222"))
В ЯМЛ анализатор может помочь вам определить, к какому типу данных относится ваша строка.Использование yaml.load()
, и тогда вы можете использовать type(result)
для проверки типа:
>>> import yaml
>>> a = "545.2222"
>>> result = yaml.load(a)
>>> result
545.22220000000004
>>> type(result)
<type 'float'>
>>> b = "31"
>>> result = yaml.load(b)
>>> result
31
>>> type(result)
<type 'int'>
>>> c = "HI"
>>> result = yaml.load(c)
>>> result
'HI'
>>> type(result)
<type 'str'>
Я использую эту функцию для этого
import ast
def parse_str(s):
try:
return ast.literal_eval(str(s))
except:
return
Он преобразует строку в ее тип
value = parse_str('1') # Returns Integer
value = parse_str('1.5') # Returns Float
def get_int_or_float(v):
number_as_float = float(v)
number_as_int = int(number_as_float)
return number_as_int if number_as_float == number_as_int else number_as_float
def num(s):
"""num(s)
num(3),num(3.7)-->3
num('3')-->3, num('3.7')-->3.7
num('3,700')-->ValueError
num('3a'),num('a3'),-->ValueError
num('3e4') --> 30000.0
"""
try:
return int(s)
except ValueError:
try:
return float(s)
except ValueError:
raise ValueError('argument is not a string of number')
Вам нужно учитывать округление, чтобы сделать это правильно.
То есть.int (5.1) => 5 int (5.6) => 5 - неверно, должно быть 6, поэтому мы делаем int (5.6 + 0.5) => 6
def convert(n):
try:
return int(n)
except ValueError:
return float(n + 0.5)
Я удивлен, что никто не упомянул регулярное выражение, потому что иногда строка должна быть подготовлена и нормализована перед приведением к number
import re
def parseNumber(value, as_int=False):
try:
number = float(re.sub('[^.\-\d]', '', value))
if as_int:
return int(number + 0.5)
else:
return number
except ValueError:
return float('nan') # or None if you wish
использование:
parseNumber('13,345')
> 13345.0
parseNumber('- 123 000')
> -123000.0
parseNumber('99999\n')
> 99999.0
и, кстати, что-нибудь, чтобы подтвердить, что у вас есть номер:
import numbers
def is_number(value):
return isinstance(value, numbers.Number)
# will work with int, float, long, Decimal
Для приведения к типу в python используйте функции конструктора типа, передавая строку (или любое другое значение, которое вы пытаетесь привести) в качестве параметра.
Например:
>>>float("23.333")
23.333
За кулисами python вызывает объекты __float__
метод, который должен возвращать плавающее представление параметра.Это особенно эффективно, поскольку вы можете определять свои собственные типы (используя классы) с помощью __float__
метод, позволяющий преобразовать его в float с помощью float(myobject).
Это исправленная версия из https://stackoverflow.com/a/33017514/5973334
Это попытается разобрать строку и вернет либо int
или float
в зависимости от того, что представляет строка.Это может вызвать синтаксический анализ исключений или иметь какое-то неожиданное поведение.
def get_int_or_float(v):
number_as_float = float(v)
number_as_int = int(number_as_float)
return number_as_int if number_as_float == number_as_int else
number_as_float
Использование:
def num(s):
try:
for each in s:
yield int(each)
except ValueError:
yield float(each)
a = num(["123.55","345","44"])
print a.next()
print a.next()
Это самый питонический способ, который я мог придумать.
Использование:
>>> str_float = "545.2222"
>>> float(str_float)
545.2222
>>> type(_) # Check its type
<type 'float'>
>>> str_int = "31"
>>> int(str_int)
31
>>> type(_) # Check its type
<type 'int'>
Это функция, которая преобразует любой object
(не просто str
) к int
или float
, основанный на том , предоставлена ли фактическая строка выглядит как int
или float
.Далее, если это объект, который имеет оба __float
и __int__
методы, по умолчанию используется __float__
def conv_to_num(x, num_type='asis'):
'''Converts an object to a number if possible.
num_type: int, float, 'asis'
Defaults to floating point in case of ambiguity.
'''
import numbers
is_num, is_str, is_other = [False]*3
if isinstance(x, numbers.Number):
is_num = True
elif isinstance(x, str):
is_str = True
is_other = not any([is_num, is_str])
if is_num:
res = x
elif is_str:
is_float, is_int, is_char = [False]*3
try:
res = float(x)
if '.' in x:
is_float = True
else:
is_int = True
except ValueError:
res = x
is_char = True
else:
if num_type == 'asis':
funcs = [int, float]
else:
funcs = [num_type]
for func in funcs:
try:
res = func(x)
break
except TypeError:
continue
else:
res = x
Вот еще одна интерпретация вашего вопроса (подсказка:это расплывчато).Вполне возможно, что вы ищете что-то подобное:
def parseIntOrFloat( aString ):
return eval( aString )
Это работает следующим образом...
>>> parseIntOrFloat("545.2222")
545.22220000000004
>>> parseIntOrFloat("545")
545
Теоретически, существует уязвимость при внедрении.Строка может, например, быть "import os; os.abort()"
.Однако без какой-либо информации о том, откуда берется строка, такая возможность является теоретическим предположением.Поскольку вопрос расплывчатый, совсем не ясно, существует ли эта уязвимость на самом деле или нет.