站內(nèi)全文搜索引擎解決方案--磐志搜索引擎
磐志搜索引擎是專業(yè)的搜索引擎技術(shù)解決方案,面向大中型網(wǎng)站提供搜索技術(shù)支持服務(wù)。
磐志搜索引擎是由總部設(shè)在廣州的廣州磐志網(wǎng)絡(luò)科技有限公司開發(fā)和提供服務(wù)。廣州磐志網(wǎng)絡(luò)科技有限公司 坐落于廣州市最繁華的天河科技區(qū)是由原來成立于2004年的磐志搜索引擎工作室發(fā)展壯大而成.是由一支年輕的搜索技術(shù)工程師隊伍組成,由知名的互聯(lián)網(wǎng)人士創(chuàng)辦。擁有專業(yè)的搜索引擎技術(shù)工程師隊伍和專業(yè)技術(shù)客服隊伍.是目前中國唯一的面向大中型網(wǎng)站提供搜索引擎技術(shù)解決方案的專業(yè)技術(shù)團(tuán)隊。
我們的宗旨:做專業(yè)的搜索引擎技術(shù)解決方案提供商。
我們的技術(shù)優(yōu)勢:專業(yè)致力于中文海量數(shù)據(jù),基于關(guān)鍵詞的檢索、索引、分詞、分析排序、存儲、負(fù)載處理 等搜索技術(shù)研究。改善網(wǎng)站服務(wù)質(zhì)量,減輕數(shù)據(jù)庫負(fù)擔(dān),提高搜索的速度、質(zhì)量,降低網(wǎng)站的經(jīng)營成本,提高 網(wǎng)站的擴(kuò)展能力,減少設(shè)備投入、提高數(shù)據(jù)的安全性。磐志搜索引擎適應(yīng)linux和windows操作平臺,支持各種 數(shù)據(jù)庫接口和不同腳本語言(PHP、ASP、JSP、ASP.net)。磐志搜索引擎能有效減輕系統(tǒng)數(shù)據(jù)庫的壓力,支持 多關(guān)鍵字搜索和句子搜索及“與、或、非”等多種組合關(guān)鍵詞搜索要求,為用戶提供快速的搜索方案,并且能 根據(jù)客戶的需求進(jìn)行用戶數(shù)據(jù)挖掘,提高網(wǎng)站系統(tǒng)的價值。
●磐志站內(nèi)搜索引擎是致力于中文海量數(shù)據(jù),針對中文特性基于關(guān)鍵詞的檢索、索引、分詞、分析排序、存儲、負(fù)載處理等技術(shù)的站內(nèi)搜索引擎解決方案,速度就是競爭力,磐志搜索通常只用0.001秒完成搜索,即是彈指間的效率,支持千萬級的海量數(shù)據(jù),高效利用系統(tǒng)資源,搜索百萬條數(shù)據(jù)下每秒100次并發(fā)訪問只占用200M的內(nèi)存.
●磐志搜索引擎能輕松幫你解決這個困擾,它支持千萬級的數(shù)據(jù)量,通過對網(wǎng)站數(shù)據(jù)庫的數(shù)據(jù)建立索引,查詢時不訪問數(shù)據(jù)庫,能有效減輕數(shù)據(jù)庫和系統(tǒng)的壓力,以毫秒級的速度完成搜索全過程,你裝上它后不需要任何維護(hù)即能提高網(wǎng)站的價值。
磐志搜索引擎能夠根據(jù)客戶的需求進(jìn)行用戶的數(shù)據(jù)挖掘,通過科學(xué)的中文分詞技術(shù)提高了搜索結(jié)果的科學(xué)性、合理性,提高有價值信息的爆光度,即是留住您的準(zhǔn)客戶的有效方法,從而提高您網(wǎng)站用戶的忠誠度。
●傳統(tǒng)的搜索是直接操作數(shù)據(jù)庫,存在很大的安全漏洞,黑客可以利用數(shù)據(jù)庫的語法漏洞提權(quán)入侵,而磐志搜索引擎由于不直接操作數(shù)據(jù)庫從而解除了以上的數(shù)據(jù)安全問題。現(xiàn)在你不需要花費(fèi)大筆費(fèi)用來擁有自己的技術(shù)團(tuán)隊就可以迅速提高自己的技術(shù)門檻,目前100萬級的數(shù)據(jù),每秒300人的并發(fā)訪問,僅占用內(nèi)存200M。
●磐志搜索引擎是通過對搜索結(jié)果進(jìn)行預(yù)處理來實(shí)現(xiàn)高速搜索的。
具體實(shí)現(xiàn)方法如下:在搜索之前首先對數(shù)據(jù)庫進(jìn)行預(yù)掃描,通過分析、轉(zhuǎn)換生成中間結(jié)果并保存起來;在搜索時,首先對搜索條件進(jìn)行分析及轉(zhuǎn)換,再找到相應(yīng)的中間結(jié)果并對這些中間結(jié)果進(jìn)行合并便可以得到符合要求的搜索結(jié)果。
由于在搜索之前就已經(jīng)生成了搜索結(jié)果,而在搜索時系統(tǒng)只需要做簡單的合并處理,從而實(shí)現(xiàn)了高速搜 索;由于可以通過對中間結(jié)果進(jìn)行不同的合并而得到不同的搜索效果,這大大的提高了搜索的靈活度,再通過科學(xué)的合并算法可大大的提高搜索的準(zhǔn)確度。
●技術(shù)優(yōu)勢:改善網(wǎng)站服務(wù)質(zhì)量,減輕數(shù)據(jù)庫負(fù)擔(dān),提高搜索的速度、質(zhì)量,降低網(wǎng)站的經(jīng)營成本,提高網(wǎng)站的擴(kuò)展能力,減少設(shè)備投入、提高數(shù)據(jù)的安全性。
1.可以幫助用戶在毫秒時間來快速搜索出結(jié)果
2.百萬條以上的海量數(shù)據(jù)搜索也只是一閃而過,輕輕松松,無需任何等待
3.用戶可以隨意組合關(guān)鍵詞進(jìn)行搜索,磐志提供完備的分詞算法支持
4.搜索關(guān)鍵詞中的同音字和錯別字也不會影響用戶搜索到正確的結(jié)果
5.提供了搜索關(guān)鍵詞的相關(guān)詞的自動匹配,幫助用戶參考
6.搜索關(guān)鍵詞不受簡體和繁體的影響,降低用戶搜索的復(fù)雜性和困難度
7.用戶無需切換全角半角來輸入關(guān)鍵詞,磐志自動匹配到正確的搜索結(jié)果
8.搜索的結(jié)果由用戶自主決定如何排序(字段、時間、關(guān)鍵詞出現(xiàn)的頻率)進(jìn)行查看
9.給用戶提供“與、或、非”等多種組合關(guān)鍵詞的搜索方法,簡單方便
●該方案主要從以下幾個方面提高網(wǎng)站的服務(wù)質(zhì)量:
●搜索速度:
數(shù)百倍的提高速度
經(jīng)測試在100萬條數(shù)據(jù)下,對比較復(fù)雜的關(guān)鍵詞組合搜索時間僅為0.05秒以下,并支持每秒100次的并發(fā)訪問
●海量數(shù)據(jù):
●不占用系統(tǒng)資源輕松自如的處理海量數(shù)據(jù)
磐志搜索引擎是基于對目標(biāo)數(shù)據(jù)進(jìn)行預(yù)掃描的方法來實(shí)現(xiàn)高速搜索的。通過科學(xué)的中文分詞技術(shù)提高了搜索結(jié)果的科學(xué)性、合理性;通過高效率的索引結(jié)構(gòu)和索引運(yùn)算算法、索引緩沖算法實(shí)現(xiàn)了海量數(shù)據(jù)的高速搜索,搜索過程不需要對數(shù)據(jù)庫進(jìn)行任何查詢操作而且不需要使用中間數(shù)據(jù)庫,這大大的減輕了數(shù)據(jù)庫的負(fù)荷。
●結(jié)果準(zhǔn)確:
提高語言習(xí)慣的搜索,使得搜索結(jié)果的更加準(zhǔn)確
通過簡繁統(tǒng)一、全半角統(tǒng)一、大小寫統(tǒng)一等技術(shù)使對中文搜索結(jié)果更加準(zhǔn)確合理
●擴(kuò)展靈活:
可定義的API接口,新增業(yè)務(wù)可以很方便的接入
提供了豐富、靈活的API(jsp是、php、asp.net),使WEB程序與搜索服務(wù)分離開來,從而讓磐志搜索使用非常簡單、靈活,使用者可以隨意的制定搜索結(jié)果顯示方式和版式。
●搜索專業(yè):
關(guān)鍵詞加亮,密集度、相關(guān)性關(guān)鍵詞分析處理提供專業(yè)化的搜索服務(wù)
3.1 功能簡介:
●結(jié)果排序
磐志搜索引擎提供按業(yè)務(wù)配置中任一一個排序字段對結(jié)果排排序的功能,如注冊日期等。同時提供按相關(guān)度排序,根據(jù)關(guān)鍵詞權(quán)重與出現(xiàn)頻度排序返回結(jié)果。如用戶搜索“原子能應(yīng)用”,應(yīng)用是一個很普通的詞,而原子能是比較專業(yè)的詞,將優(yōu)先返回出現(xiàn)原子能次數(shù)較多的記錄。
●錯別字糾正
磐志搜索引擎 的錯別字改正軟件系統(tǒng)會對輸入的關(guān)鍵詞進(jìn)行自動掃描, 檢查有沒有錯別字。如果發(fā)現(xiàn)用其他字詞搜索可能會有更好的結(jié)果,它能提供相應(yīng)提示來幫助糾正可能有的錯別字。例如,搜索“笑對”, 會自動提示 “您是不是要找:校對”。如果您點(diǎn)擊 “校對”,磐志搜索引擎 將以“校對”作為關(guān)鍵詞進(jìn)行搜索。磐志搜索引擎錯別字糾正暫建立在同音字與同義字的基礎(chǔ)上,還有待進(jìn)一步改進(jìn)。
●拼音搜索
能根據(jù)拼音提示最接近的漢字詞組,標(biāo)準(zhǔn)版的拼音搜索還有一定局限性,只能對四字以下詞進(jìn)行拼音搜索。
●相關(guān)搜索
磐志搜索引擎搜索 能夠提供與您原搜索相關(guān)的搜索詞。這些相關(guān)的搜索詞是根據(jù)過去 磐志搜索引擎所有用戶的搜索習(xí)慣和磐志搜索引擎提供的計算兩個搜索詞之間相關(guān)度的技術(shù)而產(chǎn)生出來的。這些相關(guān)的搜索詞一般比原搜索詞更常用,并且更可能產(chǎn)生相關(guān)的結(jié)果。只需點(diǎn)擊我們提供的相關(guān)搜索關(guān)鍵詞,您會自動被帶到這個詞的結(jié)果頁。磐志搜索引擎 相關(guān)搜索將幫助您更快地找到更有價值的結(jié)果。
提示:如磐志搜索引擎內(nèi)置相關(guān)搜索不能滿足你的要求,你也可將歷史搜索存入數(shù)據(jù)庫,做成一搜索業(yè)務(wù)。
3.2 系統(tǒng)要求
磐志搜索引擎要求的最低硬件配置:內(nèi)存1G 硬盤 40G
通過我們磐志搜索引擎搜索的結(jié)果比傳統(tǒng)數(shù)據(jù)庫查詢結(jié)果更快更準(zhǔn)確,排序更為合理。
磐志搜索引擎搜索通過合理的索引結(jié)構(gòu)和算法對服務(wù)器資源占用極少,經(jīng)測試100萬級的數(shù)據(jù)量單個業(yè)務(wù)每秒100個并發(fā)請求的情況下,內(nèi)存占用不會超過300M。磁盤占用在5G左右。
目前可以兼容的操作系統(tǒng):lunix/unix的各種發(fā)行版本以及winnt5.0(windows200或以上)
支持語言:php、jsp、asp .net
數(shù)據(jù)庫:mysql、postgresql、sybase、sqlserver
3.3 售后服務(wù):
(1) 提供完整標(biāo)準(zhǔn)版的“磐志搜索”安裝軟件;
(2) 提供完整的客戶網(wǎng)站的《“磐志搜索”割接和恢復(fù)方案》
(3) 提供完整的《“磐志搜索”接口文檔》;
(4) 安排專業(yè)的工程師進(jìn)行上門安裝和配置
(5) 提供“磐志搜索”的維護(hù)手冊和培訓(xùn);
(6) 提供“磐志搜索”的使用常識培訓(xùn);
(7) 在合同期內(nèi)提供“磐志搜索”的遠(yuǎn)程技術(shù)支持和維護(hù);
4.1 基本原理
磐志搜索引擎是通過對搜索結(jié)果進(jìn)行預(yù)處理來實(shí)現(xiàn)高速搜索的。具體實(shí)現(xiàn)方法如下:在搜索之前首先對數(shù)據(jù)庫進(jìn)行預(yù)掃描,通過分析、轉(zhuǎn)換生成中間結(jié)果并保存起來;在搜索時,首先對搜索條件進(jìn)行分析及轉(zhuǎn)換,再找到相應(yīng)的中間結(jié)果并對這些中間結(jié)果進(jìn)行合并便可以得到符合要求的搜索結(jié)果。
由于在搜索之前就已經(jīng)生成了搜索結(jié)果,而在搜索時系統(tǒng)只需要做簡單的合并處理,從而實(shí)現(xiàn)了高速搜索;由于可以通過對中間結(jié)果進(jìn)行不同的合并而得到不同的搜索效果,這大大的提高了搜索的靈活度,再通過科學(xué)的合并算法可大大的提高搜索的準(zhǔn)確度。
4.2 技術(shù)優(yōu)勢
我們的理念就是做最專業(yè)的站內(nèi)搜索引擎;我們的價值觀就是為您的企業(yè)創(chuàng)造方便和價值;而我們前進(jìn)的動力就是您的支持。我們的宗旨是給予您優(yōu)質(zhì)的服務(wù)、專業(yè)的技術(shù)支持,獲得您良好的口碑,讓我們能夠肯定自己的價值,堅持我們的理想。
大容量性――目前可以支持1000萬級的數(shù)據(jù),毫秒級的查詢時間,每秒100人的并發(fā)訪問。
功能性――支持分詞、多個關(guān)鍵字、簡繁、全半角、相關(guān)度處理等,使用戶看到的搜索結(jié)果更人性化。
實(shí)時性――數(shù)據(jù)庫數(shù)據(jù)的實(shí)時更新,方便客戶,數(shù)據(jù)加載自動完成,不需要人工的干預(yù),數(shù)據(jù)庫變更記錄在十分鐘內(nèi)可被搜索到。
可制定性――非常靈活,能與數(shù)據(jù)庫完美結(jié)合,實(shí)現(xiàn)數(shù)據(jù)庫sql語句能完成的大部分功能。