第492章 有些人壹出生就不壹樣啊
超級金錢帝國 by 七世狂人
2018-8-20 19:08
網易搜索引擎。
在後世擁有國內唯壹的互動性開放式目錄管理系統!
最關鍵的是,網易基本搜索的適合,查詢結果嚴謹細致,能幫助用戶找到最重要、最相關的內容。例如,當網易搜索對網頁進行分析時,它也會考慮與該網頁鏈接的其它網頁上的相關內容。網易搜索還會先列出那些搜索關鍵詞相距較近的網頁。
而在搜索多個詞語的時候,網易搜索只會返回那些符合用戶的全部查詢條件的網頁。不需要在關鍵詞之間加上“and”或“+”。如果用戶想縮小搜索範圍,只需輸入更多的關鍵詞,只要在關鍵詞中間留空格就行了。
這完全就符合張偉現有需要的條件啊,網易搜索這個名字在後世雖然並不太出名,可是說到另外壹個名字相信很多人就能耳熟能詳了——有道搜索!
其中有道搜索包括網頁搜素、購物搜索、海量詞典、視頻搜索、圖片搜索等壹系列,裏面的智能結果和精選搜索就是張偉現在想要的模式,他馬上回憶起搜索流程,結合自己的猜測。
按照當時搜索時的情況,張偉開始推測,很多部分應該和傳統搜索沒什麽兩樣,那麽新式搜索需要需要根據壹定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接並將其放入等待抓取的資源管理器隊列,然後,要根據壹定的搜索策略從隊列中選擇下壹步要抓取的網頁資源,並重復上述過程,直到達到系統的某壹條件時停止,另外,所有被抓取的網頁西藥存貯,再進行壹定的分析、過濾,並建立索引,以便之後的查詢和檢索!
也就是說,前提需要壹個自動抓取萬維網信息的程序或者腳本。
這些話對於常人來說都是廢話,可是張偉知道,對於專業人士就不是廢話了!
克裏斯等人不就是需要個流程嗎?
張偉迅速拿起筆和本子記錄了下來,這些根本不用動腦子,因為都是自己親身經歷過的事情,只需要按照步驟稍加添加自己的想法就可以。
瑤瑤玩了會,道:“張偉,妳要不要玩電腦?”
“暫時用不上了。”張偉刷刷在本子上寫著。
瑤瑤調皮地對著柳傾城做了個鬼臉,“看,張偉不要用,我再玩壹會。”
柳傾城哭笑不得道:“妳呀妳,那就再玩壹小會,眼睛離電腦遠點。”
瑤瑤啪嗒啪嗒按照鼠標,叫道:“姐姐,妳過來教我打字。”
張偉擡頭笑道:“原來妳不會打字啊?”
壹行!
兩行!
五行!
他很快就寫完了!
心情徹底興奮了起來,這些東西寫出來,估計能幫到克裏斯他們的忙吧?張偉期待著!
……
很晚才睡覺。
可是張偉老早就起來了。
再次拉著鄭文跑了壹圈網景。
剛壹走進去,就看見辦公區的工作人員都在忙碌,壹看見張偉和鄭文後,這些員工就問好起來。
“BOSS。”
“鄭總。”
“張先生。”
眾人都露出了笑容。
正巧,克裏斯剛剛過來工作。
張偉微笑道:“妳們先忙著,克裏斯,妳過來壹下。”話剛說完,瞧見負責研發這款產品的技術人員都走了進來,他補充了壹句,“妳們都過來,我和妳們說點事情。”
克裏斯道:“什麽事?我們還要忙著研發產品,昨晚稍微有點眉目。”
羅曼嘿道:“是啊,或許這是壹個突破也說不準。”
泰勒打了個哈欠,道:“可把我累壞了,昨晚兩點多才睡,清早六點多就爬起來了。”
看得出來大家都非常疲勞。
張偉和鄭文對視了壹眼,也沒有上樓,直接把眾人拉到壹旁角落的辦公桌,又叫人拿來椅子。
眾人坐下。
“那我就說壹下我猜測的流程,妳們聽聽有什麽啟發沒有。”張偉拿出小本子翻開。
聞言,克裏斯壹愕。
泰勒也楞了楞。
羅曼和其他人也有些呆。
妳說什麽?妳猜測的流程?這他媽也能猜測啊還能對我們有啟發?昨天還說要找人問問,怎麽現在又變成妳自己猜測了?這麽多精英技術人員攻克了許久的都只是稍有眉目而已,妳壹個連互聯網都不懂的人光靠猜測就行了?我去,妳以為妳是上帝啊?是造物主啊?怎麽想都能變成現實?
眾人已經全部無語。
克裏斯憋了半天,也沒好意思說別的,“那妳說我們聽聽。”
張偉也知道他們不相信,道:“反正妳們就聽聽看又沒什麽損失對不對?”
泰勒難以置信道:“會對我們有啟發?”
“應該會有吧。”張偉瞟了眼本子上的文字,說道:“需要根據壹定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接並將其放入等待抓取的資源管理器隊列。”
鄭文不太懂,瞟了瞟眾人。
可是眼前這些人懂啊,他們乍壹聽的感覺……簡直驚艷!按照張偉所說的裏面包含了三個步驟,壹,用戶提供種子URL;二,種子URL進入linkbase中新URL隊列中;三,調度模塊選取url進入到抓取模塊的待抓取隊列中,大家都是專業人士,壹聽就知道完全可行啊!張偉這個推測簡直太棒了!聽著這個推測,他們都面面相覷,怎麽這麽簡單的事情他們就沒想到呢?在場十幾個精英都沒想到的事情,居然讓壹個不懂網絡的人想到了!
克裏斯忍不住贊嘆道:“好創意!”
張偉笑瞇瞇道:“我繼續說下去,然後根據壹定的搜索策略從隊列中選擇下壹步要抓取的網頁資源,並重復上述過程,直到達到系統的某壹條件時停止,另外,所有被抓取的網頁西藥存貯,再進行壹定的分析、過濾,並建立索引,以便之後的查詢和檢索。”
克裏斯興奮了起來,道:“那就是抓取模塊讀取站點的配置文件,可以按照執行的頻率進行抓取,等到抓取到結果就返回pipeline接口中,這就是完成了抽取!”
羅曼也道:“然後把新發現的連接在linkbase裏面進行dedup,並push到linkbase的新URL模塊裏面,最後讓調度模塊選取url進入抓取模塊的待抓取隊列,之後就能反饋了啊!”
張偉和鄭文不懂這些,聽得雨裏霧裏,可是接下來這些專業人士說的話讓他們至少明白壹點,這個推測可行!
泰勒結結巴巴道:“這……這就是抓取流程了?”
克裏斯非常堅定道:“我覺得有百分之八十的成功率!可以試試看!”
聽到最專業的克裏斯這麽說,十幾個人都非常驚奇地看了壹眼張偉,他們怎麽也想不明白,壹個網絡上的外行,卻能大致推算出流程?難道這就是天生的妖孽?怪不得人家十幾歲就能執掌龐大的資產!怪不得華金資本被經營的有模有樣!上天果然是有區別的,有些人壹出生就他媽和別人不壹樣啊!