
我们有一个要求,希望将正则表达式转换为云前端支持的 Glob,反之亦然。有什么建议我们如何才能实现这一点,首先是否可能?特别是从 Regex 到 Glob,据我了解 regex 是一种超集,因此可能无法将所有 Regex 转换为相应的 Glob?
要从 glob 进行转换,您需要编写一个解析器,将模式拆分为 抽象语法树。例如,glob *-{[0-9],draft}.docx 可能会解析为 [anything(), "-", oneof([range("0", "9"), "draft"] ), ".docx"]。
然后您将遍历 ast 并输出每个节点的等效正则表达式。例如,您可能为此使用的规则可能是:
anything() -> .* range(x, y) -> [x-y] oneof(x, y) -> (x|y)
生成正则表达式 .*-([0-9]|draft).docx。
这并不完美,因为您还必须记住转义任何特殊字符; . 是正则表达式中的特殊字符,因此您应该对其进行转义,最终生成 .*-([0-9]|draft)\.docx。
严格来说,正则表达式不能全部转换为 glob 模式。 globbing 中不存在 kleene star 操作;简单正则表达式 a* (即任意数量的 a 字符)无法转换为 glob 模式。
我不确定 cloudfront 支持哪些类型的 glob(文档未返回术语“glob”的匹配项),但是 这里是一些有关普遍支持的 shell glob 模式通配符的文档。
以下是一些等效序列的总结:
| Glob Wildcard | Regular Expression | Meaning |
|---|---|---|
? |
. |
Any single character |
* |
.* |
Zero or more characters |
[a-z] |
[a-z] |
Any character from the range |
[!a-m] |
[^a-m] |
A character not in the range |
[a,b,c] |
[abc] |
One of the given characters |
{cat,dog,bat} |
(cat|dog|bat) |
One of the given options |
{*.tar,*.gz} |
(.*\.tar|.*\.gz) |
One of the given options, considering nested wildcards |
以上就是正则表达式到 Glob 以及反之亦然的转换的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号