是否有可能/建议解析我的用户输入字符串 w 正则表达式

Would it be possible/advisable to parse my user input string w regexp?

本文关键字:输入 用户 字符串 正则表达式 我的 有可能 是否      更新时间:2023-09-26

我正在尝试根据以下规则拆分字符串。

test1 test2 test3           => [test1, test2, test3]
test1 test2:a b test3:c d   => [test1, test2:a b, test3:c d]
test1 test2:"a b" test3:c d => [test1, test2:"a b", test3:c d]

我可以抛出更多的例子,但本质上,每个空格分隔的单词都应该是它在结果列表中自己的条目,除非该单词出现在冒号之后。此时,间隔的单词应被视为前一个单词的一部分,直到分号前面的下一个单词。

这样做是为了创建我自己的小搜索引擎的初始阶段,我需要一种方法来解析用户给出的输入。我试图避免强迫用户做这样的事情

test1 test2:(a, b) test3:(c, d)

虽然我想如果它更美观就好了。

我相信这可以通过javascript正则表达式来完成,但老实说,我对它们很糟糕,并且无法理解它们如何在一半的时间工作。

谁能给我关于如何以这种方式拆分字符串的建议,正确的正则表达式或其他更可取的方法?

谢谢!

编辑:

我已经有一些代码可以进行一些解析而不是使用正则表达式,但它已经变得又长又复杂了。这个问题主要是看看正则表达式是否是更好的方法。

编辑2 :

完全放弃正则表达式方法。Salman A想出了一个非常简洁的方法,可以做我想做的事,击败了我以前的代码。

我知道我应该解析它:

function parseQuery(query) {
  var tokens = query.split(/'s+/), i = 0, prev, curr;
  while (i < tokens.length - 1) {
    curr = tokens[i];
    next = tokens[i + 1];
    if (curr.indexOf(":") >= 0 && next.indexOf(":") < 0) {
      tokens.splice(i, 2, curr + " " + next);
    } else {
      i++;
    }
  }
  return tokens;
}
var tests = [
    'test1',
    'test1 test2',
    'test1 test2 test3',
    'test1 test2:a b test3:c d',
    'test1 test2:a b test3:c d e',
    'test1 test2:a b test3:c d e test4:f',
], i;
for (i = 0; i < tests.length; i++) {
  console.log(tests[i], parseQuery(tests[i]));
}
<!-- results pane console output; see http://meta.stackexchange.com/a/242491 -->
<script src="http://gh-canon.github.io/stack-snippet-console/console.min.js"></script>