分析:人名搜索Spock會成下個谷歌嗎
有哪一家網(wǎng)絡(luò)新秀Web 2.0公司不希望自己成為下一個Google公司呢?后起新秀Google公司能夠超過雅虎公司,那為什么就沒有另外一家公司能夠去“分享Google公司的午餐”?盡管Spock公司中還沒有人大膽地這樣聲稱,但這一針對人名搜索的服務(wù)于今天上午上線了。
在發(fā)布時,Spock公司的數(shù)據(jù)庫中將包含1億多人,而且它計劃通過搜索時急速走遍其它可以公開訪問的站點迅速地增加更多的人。盡管諸如Wink、ZoomInfo.com、Linkedin等與人相關(guān)的搜索站點沒有能夠改變搜索市場的格局,但Spock公司采取了不同的策略,提供了元數(shù)據(jù)搜索,向可信賴的用戶提供類似于Wikipedia的標(biāo)注權(quán)限。
據(jù)CNET News.com在最近采訪Spock公司的CEO、合伙創(chuàng)始人Jaideep Singh時發(fā)現(xiàn)更多。當(dāng)被被問到Spock公司目前已經(jīng)索引了多少人時,Jaideep Singh表示:有1億多一點。當(dāng)被問到公司每天大約增加多少用戶時,他表示增加的有二類內(nèi)容:一種是人,另一種是處理的文檔數(shù)量,因為一個人可能有多個文檔,因此我們在對整個Web進(jìn)行快速遍歷時挑選文檔,根據(jù)人組織文檔。
當(dāng)Jaideep Singh被問到他是否能夠準(zhǔn)確地解釋這一技術(shù)的工作原理時回答:如果要對一些具體關(guān)鍵字進(jìn)行搜索,Google公司的表現(xiàn)是相當(dāng)不錯的。然而問題是:如果目前在Google上搜索人,用戶獲得的將是許多與所查的人相關(guān)的文檔。如果要搜索的人有“David Stern”這樣大眾化的名字,那么搜索結(jié)果中的前幾頁的內(nèi)容可能與名為“David Stern”的NBA委員相關(guān),因此,我們無法搜索到在酒吧或商業(yè)會議上遇見的“David Stern”。據(jù)他表示,這一技術(shù)與通用搜索相比要困難得多,這是一種不同的技術(shù),它們之間唯一的相同點是遍歷。當(dāng)進(jìn)行遍歷時,我們采取的是一種不同的方法。我們不僅僅是抽取元數(shù)據(jù),而且還試圖找出文檔與誰相關(guān)。我們希望找到文檔中相關(guān)性最高的內(nèi)容。我們首先必須理解語言,理解文檔的內(nèi)容,開發(fā)自然語言處理和其它技術(shù)等。
據(jù)Jaideep Singh表示,人們應(yīng)該意識到我們與Google公司的相同點在于對Web的索引。我們將從公開文檔中獲取內(nèi)容。而且人們也要意識到,在互聯(lián)網(wǎng)上有許多與我們自己的諸如博客、MySpace檔案等相關(guān)的資料。我們的β版服務(wù)已經(jīng)運行兩個月了,我們擁有了大量的用戶,用戶的反饋也非常好,人們將會發(fā)現(xiàn)它很有用,而且也是很有趣的。
|