在同一语法中解析有效日期和数字的最简单(最短,最少规则,没有警告)的方法是什么?我的问题是匹配有效月份(1-12)的词法分析器规则将匹配任何1-12的出现。所以,如果我只想匹配一个数字,我需要一个解析规则,如:

number: (MONTH|INT);

当我为日和年添加词法规则时,它变得更加复杂。我想要一个像这样的日期解析规则:

date: month '/' day ( '/' year )? -> ^('DATE' year month day);

我不在乎月,日和日year是解析或lexer规则,只要我最终得到相同的树结构。我还需要能够识别其他地方的数字,例如:

foo: STRING OP number -> ^(OP STRING number);
STRING: ('a'..'z')+;
OP: ('<'|'>');
有帮助吗?

解决方案

问题在于您似乎想要在词法分析器和/或解析器中执行语法和语义检查。这是一个常见的错误,只有非常简单的语言才能实现。

您真正需要做的是在词法分析器和解析器中更广泛地接受,然后执行语义检查。你对lexing的严格程度取决于你,但你有两个基本选择,取决于你是否需要在每个月之前接受零:1)真正接受你的INT,2)定义DATENUM到只接受那些有效日期但不是有效INT的令牌。我推荐第二个,因为代码后面需要的语义检查较少(因为INTs在语法级别可以验证,你只需要对你的日期进行语义检查。第一种方法:

INT: '0'..'9'+;

第二种方法:

DATENUM: '0' '1'..'9';
INT: '0' | SIGN? '1'..'9' '0'..'9'*;

在词法分析器中接受使用这些规则后,您的日期字段将是:

date: INT '/' INT ( '/' INT )?

或:

date: (INT | DATENUM) '/' (INT | DATENUM) ('/' (INT | DATENUM) )?

之后,您将对AST执行语义运行,以确保您的日期有效。

但是,如果您在语法中执行语义检查,那么ANTLR允许在解析器中使用语义谓词,因此您可以创建一个日期字段来检查这样的值:

date: month=INT '/' day=INT ( year='/' INT )? { year==null ? (/* First check /*) : (/* Second check */)}

但是,当您执行此操作时,您将在语法中嵌入特定于语言的代码,并且无法跨目标移植。

其他提示

使用ANTLR4,这是我使用的简单组合语法。它使用词法分析器仅匹配简单标记,使解析器规则解释日期与数字。

// parser rules

date 
    : INT SEPARATOR month SEPARATOR INT
    | INT SEPARATOR month SEPARATOR INT4
    | INT SEPARATOR INT SEPARATOR INT4;

month : JAN | FEB | MAR | APR | MAY | JUN | JUL | AUG | SEP | OCT | NOV | DEC ;

number : FLOAT | INT | INT4 ;

// lexer rules

FLOAT : DIGIT+ '.' DIGIT+ ;

INT4 : DIGIT DIGIT DIGIT DIGIT;
INT : DIGIT+;

JAN : [Jj][Aa][Nn] ;
FEB : [Ff][Ee][Bb] ;
MAR : [Mm][Aa][Rr] ;
APR : [Aa][Pp][Rr] ;
MAY : [Mm][Aa][Yy] ; 
JUN : [Jj][Uu][Nn] ;
JUL : [Jj][Uu][Ll] ;
AUG : [Aa][Uu][Gg] ;
SEP : [Ss][Ee][Pp] ; 
OCT : [Oo][Cc][Tt] ; 
NOV : [Nn][Oo][Vv] ;
DEC : [Dd][Ee][Cc] ;

SEPARATOR : [/\\\-] ;

fragment DIGIT : [0-9];
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top