ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

在PHP中创建一个脚本解析器

2019-06-29 09:18:27  阅读:216  来源: 互联网

标签:php regex parser-generator


我有一个非常冗余的配置文件格式..我发明了一种用于编写循环的自定义脚本格式,例如:

[Config Object]
{Loop 3
    Setting[i]  = Value[i]
}
OtherSetting=X

这将导致:

[Config Object]
Setting1     = Value1
Setting2     = Value2
Setting3     = Value3
OtherSetting = X

我的第一个想法是使用正则表达式,如下所示:

!{(.*?)}!is

直到我试图将它与嵌套循环一起使用时,这确实很有效 – 你肯定知道这个“哦cr …时刻”

因为以下内容:

1: [Config Object]
2: *{*Loop 3
3:    Section[i]
4:    {Loop 3
5:        Setting[i]    = Value[i]
6:     *}*
7: }
8: OtherSetting=X

将引导正则表达式覆盖第2行和第6行之间的范围(用* s推销它们)

实际上我真的不知道如何解决这个问题,因为正则表达式在逻辑上是正确的.

的?需要Lazy-Operator,因为没有它我会在另一个方向遇到同样的问题,并且无法编写两个跟随循环.

一点点的研究让我清楚,正则表达式不是正确的方向,
但我找不到任何PHP解决方案.
那么我怎么能在PHP中按性能解析我的“循环”-script,例如一个带有循环的数组,并用计算结果替换括号内的命令?

解决方法:

评论中提到了正确的解决方案.您需要实际编写编译器/解析器.从我的编译器课程来看,我的记忆有点模糊,但这就是你如何接近它.

基本概念是将输入转换为标记(这是正则表达式正常的地方).这称为词法分析

所以:

[Config Object]
{Loop 3
   Section[i]
   {Loop 3
       Setting[i]    = Value[i]
   }
}
OtherSetting=X

成为(伪代码令牌,也许不完全是你需要的)

OPEN_BRACKET STRING(=Config Object) CLOSE_BRACKET
START_LOOP NUMBER(=3)
   STRING(=Section) OPEN_BRACKET STRING(=i) CLOSE_BRACKET
   START_LOOP NUMBER(=3)
       STRING(=Setting) OPEN_BRACKET STRING(=i) CLOSE_BRACKET EQUAL STRING(=Value) OPEN_BRACKET STRING(=i) CLOSE_BRACKET
   END_LOOP
END_LOOP
STRING(=OtherSetting) EQUAL STRING(=X)

因此,如果你的词法分析器为你提供了如上所述的一系列标记,你只需要将其解析为实际语法(因此这是你不想使用正则表达式的地方).

你的语法(对于循环)是沿着这些方向的东西(伪代码语法类似于Bison,我可能忘记了部分/故意留下的东西):

INDEXED_CONFIG_LINES: INDEXED_CONFIG_LINE | INDEXED_CONFIG_LINES INDEXED_CONFIG_LINE;
INDEXED_CONFIG_LINE: STRING OPEN_BRACKET STRING CLOSE_BRACKET EQUAL STRING OPEN_BRACKET STRING CLOSE_BRACKET;
LOOP: START_LOOP NUMBER LOOP_BODY END_LOOP;
LOOP_BODY: INDEXED_CONFIG_LINES | LOOP;

因此,您需要一个可以使用该语法来构建语法树的解析器,而不是正则表达式.你基本上只是构建一个状态机,在那里你将下一个令牌转换到某个状态(比如在循环体中等).

老实说,YAML可能会满足您的需求,而不是重新发明轮子或采用正则表达式体操.但是如果你真的需要使用你提出的循环语法,你可以看一下Symfony Yaml组件,看看它们是如何进行解析的. https://github.com/symfony/Yaml

或者你可以看看Twig有另一个有循环的解析器:https://github.com/fabpot/Twig/tree/master/lib/Twig

标签:php,regex,parser-generator
来源: https://codeday.me/bug/20190629/1324702.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有