为什么编程语言不允许标识符中的空格?
-
05-07-2019 - |
题
这似乎是一个愚蠢的问题,但我仍然不知道答案。
为什么编程语言不允许名称中的空格(例如方法名称)?
我理解它是为了促进(允许)解析,并且在某些时候,如果允许空格则不可能解析任何东西。
现在我们非常习惯于规范不会看到空格。
例如:
object.saveData( data );
object.save_data( data )
object.SaveData( data );
[object saveData:data];
等。
可以写成:
object.save data( data ) // looks ugly, but that's the "nature" way.
如果它仅用于解析,我想标识符可能在。
和之间(
)当然,程序语言将无法使用它,因为它有没有'。'但OO呢..
我想知道解析是否只是 的原因,如果它是,它有多重要(我认为它会是,否则将无法做到,除非所有的编程语言设计师只是......忘了选项)
修改强>
我对标识符一般都很好(因为fortran示例)是个坏主意。缩小到OO语言,特别是方法,我没有看到(我不是说没有)这是为什么它应该是这样的原因。在完成所有。
和第一个(
)之后。
忘记 saveData
方法,考虑一下:
key.ToString().StartsWith("TextBox")
为:
key.to string().starts with("textbox");
解决方案
在解释器或编译器构建解析树之前,它必须执行词法分析,将字符流转换为令牌流。考虑如何解析以下内容:
a = 1.2423 /(4343.23 * 2332.2);
以上的规则如何对其起作用。很难知道如何在不理解令牌含义的情况下对它进行词法化。构建一个同时执行lexification的解析器真的很难。
其他提示
因为我真的难以接受成功的事情。
我使用了 ALGOL (约1978年)的实现,其中非常令人讨厌&#8212 8212;需要引用现在称为保留字的内容,并在标识符中允许使用空格:
"proc" filter = ("proc" ("int") "bool" p, "list" l) "list":
"if" l "is" "nil" "then" "nil"
"elif" p(hd(l)) "then" cons(hd(l), filter(p,tl(l)))
"else" filter(p, tl(l))
"fi";
此外,FORTRAN(大写形式表示F77或更早版本)对空格或多或少不敏感。所以这可以写成:
799 S = FLO AT F (I A+I B+I C) / 2 . 0
A R E A = SQ R T ( S *(S - F L O ATF(IA)) * (S - FLOATF(IB)) *
+ (S - F LOA TF (I C)))
在语法上与
相同 799 S = FLOATF (IA + IB + IC) / 2.0
AREA = SQRT( S * (S - FLOATF(IA)) * (S - FLOATF(IB)) *
+ (S - FLOATF(IC)))
有了这种滥用的历史,为什么要为人类解析困难?更不用说复杂的计算机解析了。
是的,这是解析 - 人类和计算机。如果您可以安全地假设空白无关紧要,则更容易阅读并且更容易解析。否则,你可能会有一些含糊不清的陈述,不清楚事情是如何结合在一起的陈述,难以阅读的陈述等等。
在最好的情况下,这种改变会使语言含糊不清。例如,使用类似C99的语言:
if not foo(int x) {
...
}
相当于:
-
foo
的函数定义,返回类型ifnot
的值:ifnot foo(int x) { ... }
-
使用名为
intx
的变量调用名为notfoo
的函数:if notfoo(intx) { ... }
-
对名为
foo
的函数的否定调用(使用C99的not
,这意味着!
):if not foo(intx) { ... }
醇>
这只是您可能遇到的含糊不清的一小部分。
更新:我只是注意到,很明显,在类似C99的语言中, if
语句的条件将括在括号中。如果你选择忽略空格,额外的标点符号可以帮助解决歧义,但是无论你通常使用空格,你的语言都会有很多额外的标点符号。
查看Stroustrup的经典为C ++ 2000推广重载。
我们被允许在20世纪60年代在文件名中放置空格,而计算机仍然不能很好地处理它们(一切都用来打破,然后大多数事情,现在它只是一些事情 - 但他们仍然破裂。)
在我们的代码再次运作之前,我们不能再等待50年。 : - )
(当然,其他人都说过。在英语中,我们使用空格和标点来分隔单词。对于计算机语言也是如此,除了计算机解析器以稍微不同的意义定义“单词”)
使用空格作为标识符的一部分使解析真的很模糊(是句法空间还是标识符?),但是同样的类型是“自然阅读”。行为是通过关键字参数实现的。 object.save(data:something,atomically:true)
有一些语言允许标识符中的空格。事实上,几乎所有语言都限制了标识符中的字符集,这是因为解析更容易,大多数程序员习惯于紧凑的无空白风格。
我不认为这是真正的原因。
用于在 LaTeX
中创建图形的 TikZ
语言允许在参数名称中使用空格(也称为“键”)。例如,你会看到像
\shade[
top color=yellow!70,
bottom color=red!70,
shading angle={45},
]
在这个以逗号分隔的键值对列表的限制设置中,没有解析难度。事实上,我认为它比 topColor
, top_color
或 topcolor
等替代方案更容易阅读。