我该如何解析“某人写了……”电子邮件文本的一部分

How can I parse out the "somebody wrote..." part of an email text?

本文关键字:电子邮件 文本 一部分 某人写了 何解析 某人      更新时间:2023-09-26

如果你收到Github的私人信息,你可以直接通过电子邮件回复,而不是直接去网站回复。

当Github收到你的电子邮件时,它会解析消息并将其插入数据库。我也在努力做同样的事情。

但是,当我的服务器接收到原始字符串形式的电子邮件时,它会得到如下内容:

Important message here
On April 4, 2012 Somebody wrote:
    > blahblahblah
      On March 2, 2012 Somebody wrote:
           > blahblahbla

当然,我只想要重要的信息。我不想要别人以前写的那些垃圾。

是否有通用的方法来过滤掉这个?某种图书馆?

还是……我是否需要检查Gmail、雅虎和Hotmail,以确定它们在邮件底部添加了哪些垃圾邮件,然后逐个过滤掉?

Github是怎么做的?

GitHub使用他们的email_reply_parser gem。

这是GitHub用来显示从电子邮件回复中创建的评论。这段代码是开源的,以努力众包我们的电子邮件表示的质量。