如何获取有关文档的最重要信息以及我在 MarkLogic / 查询控制台中搜索的单词周围的一些行
How can I just get the most important information about a document and some lines around the word I searched for in MarkLogic / Query Console?
我是MarkLogic的新手,已经将一些PDF作为.xml文件加载并转换为我的数据库。
我的 10 个 PDF 每个大约 500 页长。如果我像这样在查询控制台中搜索一个单词,
cts.search("Infrastructurefunctions")
我将看到每个带有"Infrastructurefunctions
"一词的文档及其整个正文/内容(约500页)。而且你看不到新文档从哪里开始。
我的目标是获得与您在Google上获得的结果相似的结果:
- 仅文档的名称
- 我搜索的单词突出显示了一些单词以获取上下文
谢谢你帮我:)
函数cts.search
(以及所有其他 cts 函数)是一个低级工具。还有更多的抽象库会更好地为您工作。对于XQuery,我们有search:search
函数和相关函数。对于 JavaScript,你有JSearch
.我强烈建议您研究这些:
- 搜索 API:http://docs.marklogic.com/guide/search-dev/search-api
- JSearch: http://docs.marklogic.com/guide/search-dev/javascript
哼!
是的,有些库可以为您做到这一点,但我一直认为学习如何自己做一些事情很有趣/很重要。这为您提供了更大的灵活性。
因此,从您的结果来看:cts:walk
第二个例子是您可能正在考虑的可爱示例。
相关文章:
- 内部分区字体大小获胜'调整浏览器窗口大小时不会随媒体查询而更改
- 控制台返回var不是't定义,但它是
- j查询utc offSets的时差
- 如何有效地将游戏数据存储在URL查询字符串中
- 如何处理node.js节点mongodb中的连接和查询队列
- 如何从 HTML 查询中删除项目
- 从查询字符串参数推断出正确的数据类型
- 有没有一种方法可以在控制台关闭的情况下让console.log()在IE中记录消息
- 将curl查询转换为jQuery.ajax()
- 触发媒体查询断点时刷新页面
- 使用DynamoDB查询返回
- 如何使用Protractor从Chrome控制台获取所有日志
- 当查询不在displayField中时,引导Ajax Typeahead不显示结果
- 如何将PHP get查询转换为Meteor's HTTP.get()
- AngularJS:获取链接中没有哈希的查询字符串值
- 在控制台.log中显示查询的 [对象对象] 的字段
- 如何将 neo4j 查询打印到控制台?(Javascript)
- 我如何从浏览器控制台查询我的MongoDB集合
- 查询返回控制台日志中的项目,但是html显示Uncaught TypeError: Cannot call method
- 相同的解析查询在chrome js控制台找到记录,但不在node.js代码中