当前位置:网站大全 » 网站目录 » 中国网站 » 其他 » 站点详细

Coreseek

Tag:coreseek

网站简介:Coreseek是一款基于Sphinx的开源检索引擎,支持Tb级的全文数据索引,专门为中文用户提供免费开源的中文全文检索系统。Coreseek是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景,用户可以免费下载使用;同时针对有实际需要的客户,我们还提供专业的搜索技术与本地化的Sphinx技术支持服务(客户中,记录量最大已超过30亿条,文本容量最大已超过5TB)。我们也提供了QQ群、MSN群,广大用户可以在线及时沟通交流。Coreseek全文搜索服务器的主要特性包括:支持多种数据来源Mysql数据库支持多种MySQL文本数据的中文编码格式,目前支持的有UTF-8、GB18030;PostgreSQL数据库xmlpipe2数据管道允许用户通过xmlpip2向全文搜索服务器导入自定义格式的数据。Python可编程数据源高性能高速索引在现代CPU上可达10MB/秒(英文),在启用了中文分词后,建立索引的速度可达300K/s;高速搜索在2-4GB的文本建立的索引上搜索,平均0.1秒内获得结果;可处理大数据量在单一CPU上,实测最高可对100GB的文本建立索引,单一索引可包括100M文件支持分布式搜索支持主从式的分布式搜索,支持单一节点失效不影响整个搜索系统支持复杂的查询支持基于短语和基于统计的复合结果排序机制支持任意数量的文件字段(数值或全文文本)支持不同的搜索模式(“完全匹配”,“短语匹配”和“任一匹配”)为中文优化基于最大匹配算法的中文分词模块支持GB18030、UTF-8等多种编码的数据源针对中文的具体特点,对结果的排序进行了优化

温馨提示

1、2024-02-26,Coreseek网站世界排名0位,浏览人数已经达到0次,网站关注度0。如果需要了解该站的相关权重信息,可以使用"爱站工具""Chinaz站长工具"查询,本页的网站数据不是实时更新、仅供参考,建议大家以爱站查询数据为准。关于Coreseek网站价值评估:如访问速度、搜索引擎收录情况以及索引量、用户体验等;当然,要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找Coreseek的站长进行洽谈提供。如该站的IP、PV、跳出率等信息!

2、本网页的Coreseek​官网信息收录于2024-02-26,内容来自互联网收集与整理。由于Coreseek​网站不属于今日学习吧所拥有,后期发展无法实时掌控。随着时间的变化,本页网址指向的网站内容可能会有所变动,今日学习吧无法保证外部链接的合法性。因此,请大家查阅Coreseek​网站信息时,谨慎选择、自真伪,注意保护好个人信息,感谢你的理解与支持(74.0)。

Coreseek

相关文章:

1. coreseek