如何从字符串中检测编程语言

How to detect programming language from a string

本文关键字:检测 编程语言 字符串      更新时间:2023-09-26

我正在寻找一种测试特定字符串的方法,以确定它是否包含代码。

例如,我想传递一个字符串,例如"body{font-weight:bold;}",并确定它是CSS。

我想这样做:

HTML,CSS,JavaScript,红宝石C、 C++,C#

我猜它会是某种regex,但我很困惑!

您需要某种使用启发式/统计方法的分类器。如果输入字符串较大(例如,很难说=属于哪种语言),则准确性会更好。

下面是一个使用贝叶斯方法的分类器示例http://www.rubyinside.com/sourceclassifier-identifying-programming-languages-quickly-1431.html

highlight.js脚本在javascript中进行检测。看看来源。