如果在Chrome中双击英文文本,则会突出显示您单击的以空格分隔的单词。这并不令人惊讶。然而,前几天我在阅读日语文本时点击了一下,注意到有些单词在单词边界处突出显示,尽管日语没有空格。以下是一些示例文本:
どこで生れたかとんと見当がつかぬ.。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している.。
例如,如果你点击薄暗い,即使它不是一个单一的字符类(这是汉字和平假名的混合),Chrome也会正确地将其突出显示为一个单词。并不是所有的亮点都是正确的,但它们看起来并不是随机的。
Chrome如何决定在这里突出显示哪些内容?我试着在Chrome源中搜索日语单词,但只找到了一个实验模块的测试,该模块在我的Chrome版本中似乎并不活跃。
因此,V8有一个非标准的多语言分词程序,它可以处理日语。
函数tokenizeJA(Text){var it=Intl.v8BreakIterator([';ja-jp';],{type:';word';})it.adadtText(Text)var words=[]var cur=0,prev=0 while(cur<;text.length){prev=cur cur=it.next()words.push(text.substring(prev。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している.。';)//[";どこ";,";で";,";生れ";,";たか";,";とんと";,";見当";,";が";,";つ";,";か";,";ぬ";,";。";,";何でも";,";薄暗い";,";じめじめ";,";した";,";所";,";で";,";ニャーニャー";,";泣";,";い";,";て";,";いた事";,";だけ";,";は";,";記憶";,";し";,";て";,";いる";,";。";]。
点击“发布您的答案”,即表示您同意我们的服务条款、隐私政策和Cookie政策。
不是你想要的答案吗?浏览标记的其他问题或提出您自己的问题。