頂點小說網->都市->重生2002之奈米人生->章節

第三十五章 徐勇的辭職

熱門推薦: 宇宙級寵愛 我有一座天地當鋪 我真不是魔神 從嚮往開始制霸娛樂圈 食物鏈頂端的猛獸 特種兵之戰狼崛起 諸天新時代 劍仙三千萬 女配她天生好命 都市國術女神

9月18號。

這是個勿忘國恥的日子。

在這一天,百度宣佈了重大的訊息。

網易新聞:

“昨日,中文搜索引擎百度公司宣佈,該公司兩位創始人之一的元老徐勇將於本月26日

徐勇在5月份的時候就提交了辭呈,徐勇和百度都未解釋辭職原因。百度內部人士透露,暫時沒有人替代徐的職位,徐目前所負責的業務將分割到各相關部門。

徐勇曾是百度持股僅次於李彥宏的高管。1999年,徐勇和校友兼好友李彥宏建立了百度,並擔任副總裁職位;今年初,徐的職務由副總裁變為首席策略官,負責公司戰略方向。徐勇表示辭職後將在自己的‘老本行’生物學領域發展。”

百度收購了搜夏引擎後,再次鞏固了自己中文搜索霸主的地位,原本在上一年度發展得如火如荼的慧聰網,如今已經被百度打得節節敗退。

在此之前,百度在中文搜索結果質量的各項指標上,百度的工程師表現得非常聰明,在某些點上也做得很細很出色,雖然對比 google 還是有優勢,但是在與搜尋相關的基礎技術上,百度還是全面落後。

百度的搜尋質量提高,有很大部分是依靠人工做大量細的策略調整硬拉上去的。而在百度收購了搜夏之後,其在與搜尋相關的基礎技術上則有了很大的突破,其技術上的創新能力在今年一而再被媒體提及,而其商業模式仍舊是其詬病所在。

聯合創始人徐勇離職,李彥宏加強公司控制權,這基本上是所有人看到訊息的第一想法。年初徐勇任cso,明白人一眼就可以看出,這其實是個有點虛的職位。

而媒體的相關猜測是:徐勇的離職是百度為上市進行人事調整的一環,是為百度上市融資“讓道”。

這種說法是有道理的,在6月份的時候,百度便已經進行了第三次融資,這是上市前的最後一次融資,這一次是策略性融資,引進了googli以及dfj等八家風險投資機構共投資1500萬美元,股數225萬股,摺合股份7.98%,而夏夢持股降為11%,預計公開發股後,夏夢的持股會變成9%。

縱觀在納斯達克上市的中國網際網路企業,無一不在上市前上演高層人事調整的大地震,百度也不例外。

只是為何在百度的這場人事調整大地震中,徐勇為什麼會出局呢?這其中的機密除了百度的高層估計其他人都不知道真實答案。

甭管徐勇為何出局,反正這訊息對陳義哲而言,就是一個好消息。

知道訊息的第一時間,陳義哲便給了徐勇打去了電話,“徐哥,徐總,現在沒事一身輕,應該有時間過來鵬城這邊逛逛了吧?”

“我就怕一到你那邊,我一身又變重了!”徐勇笑道。

“徐哥,你這是怕我往你身上塞黃金嗎?”陳義哲打趣道。

“真的?那我這次可得順便帶個麻袋過去才行!”徐勇笑道。

“只要你來,你就是開著大貨車過來也行!”陳義哲說道。

9月底的時候,徐勇果然來鵬城了。

陳義哲帶著徐勇參觀了cdss專案目前的情況。

長達一年多的時間裡,徐勇陸陸續續發來了大量的醫院臨床資料,而cdss項目組多達30個人的技術人員就一直在做標準化資料的工作。

目前夏夢已經在陳義哲的方案設計下,初步開發了支援闌尾炎,肝結核,胃結核等幾項特殊疾病的cdss。

“怪不得搜夏引擎的技術讓百度技術團隊驚為天人,看來夏夢網際網路內部是人才濟濟啊。”徐勇感嘆道。

“呵呵,百度的技術也不差,你看google都被百度擋在國門外,現在google也只能曲線入華。”陳義哲笑道。

徐勇搖了搖頭,說道,“說句真心話,百度和google還是有一定的差距的。只是在國內市場,百度佔了天時地利,這其實是‘百度更懂中文’地一個集中體現。就簡單地說分詞,百度當年做分詞,先從一個人工編輯號地字典開始,用這個字典跑一些網頁,觀察裡面地bad case。”

“可能是分詞過細,或者是中文人名沒分出來,然後就嘗試根據中文語法規律加入規則或新增詞表解決這些 bad case,如此往復,直到有滿意的結果。上線應用,發現有新的 bad case 就再研究加規則,當然也有自動流程發現和確認如“人艱不拆”之類的新詞!”

“徐哥,想不到你這個醫藥出身的也懂得這其中的技術!”陳義哲笑道。

“都在這一行幹了五年了,沒吃過豬肉,也見過豬跑。”徐勇自嘲道,緊接著他繼續道,“google和百度最大的區別,就是google更加強調技術,它做分詞則是把問題看成一個機率問題:如果頁中哪些字經常一起出現,那麼它們很有可能就是一個詞。看哪些詞後面會跟的地得,的地得後面有常跟哪些詞,語法結構也就出來了。”

“解題思路就是把所有抓到的頁往 mapreduce 一丟,引數算出來就好了。評估分詞質量的方法也很簡單,就拿新模型放到網頁檢索的模型,做個實驗看質量有沒提升就行。這套方法結果之好,基本把中文分詞做成了一個沒有多少懸念的簡單問題!”

“其實這也是google不懂中文的問題,因為它不需要中文語言專家的參與!同時這也就是 google 做實時翻譯的思路。”陳義哲接著道,“不過這種方法雖然簡單,看似沒有什麼秘密可言,可是首先,google得先有這麼多的網頁資料,還得有大機群,有分佈計算框架,還有可複用的模型……這點套在cdss其實也一樣,cdss也需要大資料,計算的模型,看似簡單,但是其實複雜無比!”

“這是必然的,畢竟醫學上的知識太複雜了,做cdss專案往往需要考慮非常多的患者因素,如症狀、體徵、實驗室檢查數據、家族史、基因、流行病學資料、現有的醫學文獻等等。同時新發表的臨床研究數以萬計,質量參差不齊,這些大量的資料導致了即使cdss開發出來,最終維護上仍會存在巨大困難。”

“目前較為成功的臨床決策支持系統往往侷限於某個領域,覆蓋範圍有限。比如,1971年上線使用的leeds腹痛診斷系統,其診斷的正確率高達90%以上,而醫生的診斷正確率在80%以下,但這套系統僅僅也只能用於診斷腹痛。由此可見,cdss專案的研發路遙遙而修遠兮!”徐勇不由嘆道。

“徐哥,目前大多數的臨床決策支持系統,通常會包括三個組成部分:知識庫,推理機和人機交流介面。知識庫儲存著大量的編譯資訊,通常採用if-then規則進行儲存和管理。”

【穩定運行多年的小說app,媲美老版追書神器,老書蟲都在用的換源App,huanyuanapp.org】

“例如,關於藥物的相互作用,規則可以寫成“if服用了藥物x,and服用了藥物y,then顯示警告資訊”。高階使用者也可以根據自身需要在另外的編輯介面中自定義知識庫裡的規則,比如對新藥進行實時更新等。推理機則根據知識庫裡的規則對患者的資料進行自動整合、分析。人機交流介面則是將分析結果反饋給使用者或者作為系統輸入。”

陳義哲看了徐勇一眼,繼續道,“這種採用知識庫的臨床決策支持系統確實會出現臨床資料複雜化,更新維護困難上的問題。不過我已經準備在著基礎上,採用人工智慧的形式!”

“人工智慧?”徐勇驚訝道,雖說人工智慧提出了將近40年,各國也投入大量資金研究,可是目前並沒有大的突破,而且據他聽聞,google已經在前兩年開始進入了這一領域。

陳義哲點了點頭,“透過機器學習從已有的經驗中自動攫取規則,讓cdss系統不僅僅成為資料的輸入者,也要讓它成為資料的採集者。”

“夏夢這邊的ai是基於那種構建方法?”徐勇好奇地問道。

“主要是基於人工神經網絡和遺傳算法的結合!”陳義哲答道,其實確切地說,若是最終確定把cdss推出市面,那其ai終端必然是大白,唯有如此,才能保證數據及時地被大白吸收,而診斷也不會輕易的有白痴問題的出現!

相關推薦:唯我獨法21世紀星際走私時空走私從2000年開始未來圖書館我的重返2002網遊之開局獲得神級傳承我的馬甲有點多我在美漫世界有一個商店當無限降臨異世界的魔王大人