希腊语音节库的Javascript

Greek syllabification library for Javascript

本文关键字:Javascript 语音      更新时间:2023-09-26

有谁知道用Javascript编写的希腊语音节库或脚本吗?我尝试使用Hyphenator.js,但结果很差…

<script src="Hyphenator.js" type="text/javascript"></script>
<script src="patterns/grc.js" type="text/javascript"></script>
<script type="text/javascript">
    var hyphenchar = '|';
    Hyphenator.config({hyphenchar:hyphenchar});
    var t = 'αποκαλυψις ιησου χριστου ην εδωκεν αυτω ο θεος δειξαι τοις δουλοις αυτου α δει γενεσθαι εν ταχει και εσημανεν αποστειλας δια του αγγελου αυτου τω δουλω αυτου ιωαννη'.split(" ").map(function(word){return Hyphenator.hyphenate(word, 'grc')});
    console.log(t);
</script>

将输出:

["απο|κα|λυ|ψις", "ιησου", "χρι|στου", "ην", "εδω|κεν", "αυτω", "ο", "θεος", "δει|ξαι", "τοις", "δου|λοις", "αυτου", "α", "δει", "γε|νε|σθαι", "εν", "ταχει", "και", "εση|μα|νεν", "απο|στει|λας", "δια", "του", "αγ|γε|λου", "αυτου", "τω", "δουλω", "αυτου", "ιω|αν|νη"]

这显然表明连字符在音节化方面并不能完美地发挥作用。也许连字符是可以的…

注释后添加:

我期望库将"iesou"answers"theos"连字符连接起来,但事实证明,有一个连字符的minwordlength设置。将其设置为2,结果会更好。一些消息来源称,由于许多原因,自动连字符/音节识别并非100%准确。但这对我来说已经足够了

正如在注释中所说,短单词默认情况下没有连字符(因为它没有排版意义)。但是,它可以被强制:

Hyphenator.config({hyphenchar:hyphenchar, minwordlength:1});