世界社區
關于【迅搜全文檢索】技術說明
admin | 2017-05-24 23:51   2257   0
搜全文檢索:迅搜全文檢索是國產研發的一款全文檢索系統,中文分詞也比較完善。他是目前國內唯一的一款全文檢索系統。對于中文是很好的!適用于中國范兒! 
ElasticSearch全文檢索相對于迅搜功能更加強大,擁有數據化界面,智能分析,一目了然。這個是【迅搜】沒有的。同時,ElasticSearch全文檢索在技術上更加成熟。是國際十大全文檢索之一。 


Xunsearch 是一個高性能、全功能的全文檢索解決方案。 


Xunsearch 旨在幫助一般開發者針對既有的海量數據,快速而方便地建立自己的全文搜索引擎。 

Xunsearch 中文譯名為“迅搜”,代碼中的經常被縮寫為 XS,既是英文名稱的縮略也是中文聲母縮寫。 這兒的“迅”是快速的意思,至少包含了兩層涵義:其一代表了搜索結果的響應能力,其二則為二次開發難度、速度。 
Xunsearch 采用結構化分層設計,包含后端服務、前端開發包兩大部分,層次清晰而不交叉。 其中后端是采用 C/C++ 編寫的守護進程,而前端采用最為流行的腳本語言 PHP ,對于 web 搜索項目更為方便。 具體參見架構設計 
Xunsearch 極大程度降低的搜索開發的難度,除了常規的中文分詞、字段檢索、布爾語法等功能外, 還比其它免費的解決方案提供了用戶急需的相關搜索、拼音搜索、結果高亮、搜索建議等等。 具體的清單請參見我們的功能列表 
Xunsearch 真正全面開源,并使用最流行的開源許可協議 GPL 發布。您可以免費獲取本項目的全部源代碼, 自由的使用它,并在許可條件下修改和再分發,具體參見授權聲明文件。 
1. 應用領域前提是要有一定的 PHP (或其它對應的 SDK 語言) 開發能力,并備有 Unix 類型操作系統的服務器至少一臺。 
Xunsearch 可以幫助您建立各種行業門戶/垂直搜索、BBS 論壇搜索、CMS/Web站內搜索、文檔/文獻資料檢索, 以及各種基于現有數據庫系統的全文檢索。 
2. 歷史淵源大約在 2006 年創始人 hightman 開始了全文檢索的相關探索,先是發布了純 PHP 實現的中文分詞代碼, 之后又推出了 MySQL/MyISAM 全文索引的中文分詞補丁 MyFT。經過一系列不斷完善和改進后,于 2007 年正式發布中文分詞項目 scws 并一直維護至今。 
起初開發分詞的目的就是為了解決中文的全文檢索,全文檢索技術雖然已經趨于成熟,但多為商業產品。免費開源、 并且要好用的還真難找了,于是萌動了自己開發全文檢索的念頭。2008 年推出了比較粗糙的搜索解決方案 FTPHP, 之后于 2010 年又開啟了 Xungle 項目,直接免去各種技術需求,為用戶提供包含軟硬環境在內的搜索服務。 
在 Xungle 項目的運作過程中,我們發現還有大量的用戶出于各種原因,不得不自行解決搜索技術。此外, 我們發現了國外一個優秀的開源搜索引擎基礎庫 Xapian,它采用 C/C++ 開發,并且性能卓越,久經考驗。 但是并沒有整合中文分詞,并且開發難度、復雜度也較大。于是我們下決心整合 Xapian 和 Scws,并在此基礎上 提供更多、更常用的搜索功能。這就是 Xunsearch ,目前版本發布正在準備中,代碼也已托管到 github 中。 
3. 開發團隊本項目由杭州云圣網絡科技公司創立并維護,同時也是唯一就 Xunsearch 提供相應的商業技術服務、支持的公司。
最新評論
最新評論
?2015-2019 發現世界搜索引擎 | 東莞達之夢網絡科技有限公司 | 粵ICP備18115460號-1 | 世界社區 |

粵公網安備 44190002003710號

|
874 經驗
30 貢獻值
千斤顶或更好50手免费试玩