去年 11 月的一個深夜,一位 Bronx 的 54 歲老婦來到哥倫比亞大學醫(yī)療中心,她說自己頭痛欲裂,視力已經(jīng)開始模煳,左手也變得麻木且不聽使喚了。醫(yī)生進行初步檢查后決定對老婦的頭部進行 CT 掃描。
轉(zhuǎn)眼幾個月過去了,今年 1 月份的一個早晨,四位還在培訓中的放射科醫(yī)生擠在醫(yī)院三樓的一臺電腦前。放置這臺電腦的房間沒有窗戶,除了屏幕的光,里面完全是漆黑一片,就像一片深海。四位醫(yī)生盯著屏幕看時,哥倫比亞大學的神經(jīng)放射科主任 Angela Lignelli-Dipple 正拿著鉛筆和平板電腦站在他們身后。他們可不是在搞什么秘密項目,主任只是在訓練這些菜鳥醫(yī)生如何看懂 CT 掃描而已。
“如果 CT 上大腦的區(qū)域變灰,我們很容易就能診斷出病人是否中風了,”主任說道?!耙肴〉幂^好的治療效果,就必須趕在神經(jīng)細胞大量死亡前診斷出病因?!敝酗L一般因堵塞或出血引起,神經(jīng)放射學家有大約 45 分鐘的窗口期進行診斷,這樣醫(yī)生才能及時采取干預措施,如溶解正在不斷膨大的凝塊?!叭绻銈儺敃r身處急診室,每分鐘都是極端寶貴的,因為大腦的某部分正在死亡,時間就是生命。”主任補充道。
時間一分一秒流逝,主任看了看墻上的掛鐘,問道:“找到問題出在哪了嗎?”
中風通常是不對稱發(fā)展的,畢竟腦部供血會分左右,繼而細化為細小分支。不過,一旦出現(xiàn)凝塊或出血,就會影響一個分支,使大腦部分區(qū)域出現(xiàn)異常。隨著神經(jīng)細胞因為缺血而逐漸死亡,組織會略微腫脹,在掃描時,解剖結(jié)構(gòu)之間清晰的邊界可能會變模煳,最終組織會皺縮,并產(chǎn)生干燥的陰影。但需要注意的是,這塊陰影通常在中風后幾小時或幾天才出現(xiàn),而這時醫(yī)生干預的窗口期已經(jīng)結(jié)束了。主任表示:“在這之前進行掃描的話,你只能在 CT 圖像上看到一些蛛絲馬跡?!倍@就是中風的前兆。
好啦, 現(xiàn)在說回文章開頭提到的 54 歲老婦,她的 CT 掃描是對頭骨的橫切面切割額圖,看起來就像從底部一噼到頂?shù)奶鸸?。坐在電腦前的醫(yī)生們?yōu)g覽著圖層,把小腦、海馬區(qū)、島狀皮層、紋狀體、胼胝體、腦室等都分得清清楚楚。隨后,其中一名快 30 歲的男醫(yī)生在一張照片上停了下來,他拿鉛筆指著大腦右側(cè)邊緣區(qū)域說道:“這一塊有點不對勁,邊緣區(qū)域看起來有些模煳了?!辈贿^,對筆者來說,從這張像素不怎么清晰的模煳照片怎么能看出有用的信息啊,但那位男醫(yī)生顯然看到了一些不同尋常之處。
“哪里模煳了?”主任問道?!澳隳苷f清楚點嗎?”
這名醫(yī)生沒著急回答,他停下來在腦中組織了詞語,想想到底該怎么解釋。隨后,他聳聳肩表示:“它確實不太正常,我也不知道有什么毛病,只是看起來比較有趣。”
接下來,主任又拿出了第二張 CT 片,這是第一張拍攝后 20 小時后掃描的。剛剛那位醫(yī)生指出的部位在這張片子中已經(jīng)腫脹的像葡萄那么大了,而且顏色也暗了下來。隨后主任又拿了一系列的片子讓他們看,圖中慢慢出現(xiàn)了一個明顯的灰色楔形區(qū)域。
當那位老婦到達醫(yī)院時,神經(jīng)科大夫試圖用溶栓類藥物幫她疏通動脈,但很遺憾,她來的太晚了。第一次掃描過去幾小時后,老婦就失去了意識,醫(yī)生趕緊將她送去 ICU 病房。兩個月后,老婦還是沒有好轉(zhuǎn),她的整個左側(cè)身體(從左臂到左腿)都癱瘓了。
從小黑屋出來后,筆者跟著主任去了她的辦公室,我想知道醫(yī)生是怎么學習的,機器也能學會這些方法嗎?
能力不是看書得來的
筆者涉足醫(yī)學診斷行業(yè)并不晚,1997 年就在波士頓開始了臨床輪轉(zhuǎn)。為了更好地完成工作,我讀了一本有關醫(yī)學教育的經(jīng)典讀物,這本書將診斷行為明確分為四個階段:第一,醫(yī)生需要借助病人病歷和最新的體檢來搜集有關病人的疾病或身體狀況的事實;第二,整理以上信息并總結(jié)出一份可能病因的綜合列表;第三,通過對病人的詢問和初步測試完成所謂的“鑒別診斷”,即排除某種疾病的假設并增強另一種疾病的可能性。這一步,還要對疾病是否常見下定義,并結(jié)合病人既往病史對風險和暴露情況進行判斷(謹記“不可掉以輕心”的臨床思維),這樣列表中的可能病因就減少了;最后,醫(yī)生需要重新通過實驗室檢查、X 光或 CT 掃描來確認假設。數(shù)十年來,這些步驟及實踐中出現(xiàn)的變體都如實出現(xiàn)在教科書中,我們也從一代代醫(yī)學院學生的身上看到了這幅圖景:他們從癥狀中尋找病因。
不過,隨著從業(yè)經(jīng)歷的豐富,我很快發(fā)現(xiàn),真正的診斷可不像教科書上那么簡單。我所在醫(yī)學院的主任是一個優(yōu)雅的新英格蘭人,他總穿著拋光的便鞋,口音濃重,并以成為專家診斷醫(yī)師而自豪。在診斷時,他會要求病人表現(xiàn)出某種癥狀,如咳嗽。隨后他會靠在自己的椅子上思考片刻,然后嘴中冒出一串形容詞,如“微弱但刺耳”,“底噪有點大”,仿佛是在描述一瓶陳年波爾多紅酒。對我來說,這些咳嗽聲聽起來都一個樣,但我會不自覺地應和這位主任,就像一個對品酒一竅不通但還要硬裝專家的傻瓜。
這位主任的做法確實有其依據(jù),因為咳嗽分類學家會很快通過聲音來縮小可能的病因范圍。如醫(yī)生可能會認為“這聲音聽起來像一種肺炎”或“充血性心力衰竭的濕疹”,隨后通過一系列問題,醫(yī)生就能判斷病人的大致情況,最后借助測試來證明自己的判斷,大多數(shù)情況下,醫(yī)院的“老司機”們準確率還是非常高的。
幾年前,巴西的研究人員研究了放射科醫(yī)生的大腦,為的就是理解他們到底如何做出診斷的。這些經(jīng)驗豐富的醫(yī)師在看 CT 圖像時是不是心里有一份“對照表”?或者說他們使用了“模式識別或非分析推理?”
參與這次研究的放射科醫(yī)生共 25 人,他們被要求評估肺部的 X 光,而核磁共振成像機則會隨時跟蹤他們的大腦活動。X 光圖像在他們面前一晃而過,其中一些包含很常見的單一病理性損傷,如肺炎時出現(xiàn)的棕櫚狀陰影或積聚在肺內(nèi)襯層后面發(fā)暗且不透明的流體壁。第二組圖像中鑲嵌了動物的圖像來干擾,第三組則加入了字母表的字母輪廓。在測試時,這三組圖像會隨即展示給參與的 25 位醫(yī)生,他們必須快速說出圖像的屬性,而核磁共振機則一刻不停的監(jiān)視著醫(yī)生的大腦。測試結(jié)果顯示,醫(yī)生做出診斷的平均時間為 1.33 秒,而在分辨三種圖像時,大腦亮起的區(qū)域相同,即左耳附近的神經(jīng)元寬三角洲以及顱骨后基上方的蛾形帶。
“我們的測試結(jié)果能支持這樣的假設:醫(yī)生發(fā)現(xiàn)一種特征和已知病變的過程與日常生活中命名事物的過程相似?!毖芯咳藛T總結(jié)道。也就是說,識別病變與為動物命名的過程非常相似,當你認出一頭犀牛,你不會再想想其他替代動物,更不會將犀牛與獨角獸、犰狳和小象等動物弄混。對你來說,辨認犀牛已經(jīng)是一種模式,而放射科專家也是如此。他們不需要沉思、回憶以及區(qū)分,他們看到的是一個常規(guī)現(xiàn)象。對我的主任來說,那些咳嗽聲音也像叮當聲一樣容易辨認。
“紙上談兵”與“實踐出真知”
1945 年時,英國哲學家 Gilbert Ryle 舉辦了一場影響力巨大的講座,其主題涉及兩大知識。一個孩子知道自行車有兩個輪子,輪子充氣,車通過踩踏腳踏板來獲得前進動力。Ryle 將這種知識稱之為“書面知識”。不過,學習騎自行車光懂得這些可不夠,一個孩子要經(jīng)歷摔倒才能學會平衡,學會通過坑坑洼洼的路面。Ryle 將這種隱性的、體驗式的、基于技能的知識稱為“實踐知識”。
這兩種知識看起來是相互依賴的,因為你可以用書面知識來強化實踐知識,反之亦然。不過,Ryle 警告大家要抵制所謂“書面知識”可以轉(zhuǎn)化為“實踐知識”的想法。光看看自行車說明書孩子不可能學會騎車。Ryle 認為,只有當我們知道如何運用規(guī)則時,規(guī)則才能真正發(fā)揮作用,“規(guī)則就像小鳥,必須吃飽了才能生存?!币惶煜挛?,筆者 7 歲的女兒正騎著車爬上一個小山丘。她第一次嘗試時停在了斜坡最陡峭的部分,然后摔倒了。第二次嘗試時她屈身向前傾斜,最初角度很小,隨后越來越明顯;而當坡度減小時,她會向后增加重量。但是,我可沒教過她騎自行車爬上那座小丘的規(guī)則。我想,當我的孫女學習騎自行車翻過這座小丘時,家長也不會教她這些規(guī)則。我們會傳授一些與宇宙有關的規(guī)則,但是會將剩下的留給大腦來解決。
旁聽了 Lignelli-Dipple 的教程后,我與 Steffen Haider 交談了一番,他是個通過 CT 掃描就能發(fā)現(xiàn)早期中風的年輕人。他是怎么發(fā)現(xiàn)病變的?靠的是“書面知識”還是“實踐知識”呢?
Steffen Haider 表示自己先要學習規(guī)則,在書中他得知中風往往發(fā)生在一邊,組織在 CT 中會輕微“變灰”,且常常伴有略微腫脹,造成解剖邊界模煳?!霸谀承┎课?,大腦的供血特別脆弱?!彼f道。要想認出這些病變,他必須在大腦的一側(cè)尋找那些另一側(cè)沒有出現(xiàn)的跡象。
筆者提醒他忽視了圖像中很多不對稱的情況。這個 CT 掃描與大多數(shù)情況一樣,在腦部左側(cè)存在其他灰色的波紋,但右側(cè)卻沒有,它們可能是婦女中風前大腦中的異常運動或潛在變化。他是如何把重點縮小到這片區(qū)域的?他停了下來,沉思了一會,隨后說道:“我也不知道,有一部分是存在于潛意識里的?!?/p>
“對于一個放射學家來說,這是在學習和成長中自然習得的。”Lignelli-Dipple 說道。于是筆者開始思考,機器是否也能用同樣的方式進行“學習和成長”。
Thrun 的理想世界
2015 年 1 月,計算機科學家 Sebastian Thrun 開始迷上了醫(yī)學診斷這個課題。Thrun 在德國長大,他身材消瘦,剃了光頭,看起來就像漫畫里的人物。Thrun 以前是斯坦福大學教授,領導該校的人工智能實驗室,后來他離職創(chuàng)建 Google X,領導會自學的機器人和自動駕駛汽車的研發(fā)。但是,他發(fā)現(xiàn)自己對有著學習能力的醫(yī)療設備有很大的興趣。Thrun 的母親因乳腺癌離世,當時她才 49 歲。“大多數(shù)癌癥病人一開始沒有癥狀?!盩hrun 說道?!拔夷赣H就是這樣,但當她去看醫(yī)生時,一切都晚了。因此,我一直想找到一個能盡早發(fā)現(xiàn)癌癥的方法,畢竟那時我們還能將病人從死亡線上拉回來。機器學習算法在這里能起到作用嗎?”
學界關于自動診斷的早期研究往往與教科書上的顯性知識緊密相關。以心電圖為例,過去的二十年來,電腦解讀的通常是這些系統(tǒng)的特征,執(zhí)行這些工作的程序也比較直接,特征波形與多種情況相關,如心房顫動或血管阻塞。此外,還有識別這些特征波形并輸入到應用中的規(guī)則。當機器識別到這些特征波形時,它會把這種心跳標記為“心房顫動”。
乳腺癌的檢查與心電圖類似,眼下“計算機輔助檢查”的方式已經(jīng)不再新鮮。在檢查中,模式識別軟件會標記那些疑似出現(xiàn)病變的區(qū)域,隨后醫(yī)生需要對這些可疑區(qū)域進行復查以確定診斷結(jié)果是否正確。不過,如今的診斷軟件大多數(shù)利用的還是基于規(guī)則的系統(tǒng),它們沒有自行學習的能力。因此,一個看過 3000 張 X 光片的機器人其實水平跟只看過 4 張的差不多。2007 年的研究進一步證明了這種檢測方法的局限性。人們通常認為機器介入后,準確率會明顯提高,但事實上機器產(chǎn)生的影響很復雜。在計算機輔助診斷組中,活體檢查的準確率上升,但腫瘤學家最希望檢測到的小型侵入性乳腺癌準確率卻有所降低(后續(xù)檢測中甚至出現(xiàn)了“假陽性”問題)。
Thrun 相信,他能將第一代診斷設備上基于規(guī)則的算法替換為基于學習的算法,這樣一來設備就拋棄了“書面知識”,學會了“實踐知識”。Thrun 的學習算法還加入了現(xiàn)在最為火熱的“神經(jīng)網(wǎng)絡”技術,因為該技術的靈感源于大腦運作的模型,所以它能完成這一學習過程。在大腦中,神經(jīng)突出會通過反復激活而遭到增強或削弱;這些數(shù)字系統(tǒng)旨在通過數(shù)學手段實現(xiàn)類似的目的,調(diào)整連接的“權(quán)重”向預期輸出靠攏。更強大的系統(tǒng)會與神經(jīng)元層級相似,每個系統(tǒng)會分別處理輸入的數(shù)據(jù)并將結(jié)果傳送給下一層,而這就是我們所說的“深度學習”。
Thrun 首先拿皮膚癌開刀,特別是美國人非常容易罹患的角化細胞癌和黑色素瘤(非誠勿擾 2 里孫紅雷得的,最恐怖的皮膚癌)。機器經(jīng)過學習,能在圖片上分清皮膚癌和那些良性皮膚?。ㄈ缍欢?、皮疹等)嗎?“如果皮膚科醫(yī)生能做到,那么機器肯定也能搞定,而且可能會做得更好?!?/p>
通常情況下,關于黑色素瘤的教學會從基于規(guī)則的系統(tǒng)開始,就像皮膚病醫(yī)生入門一樣。學習過程中會有一系列便于記憶的符號,如 ABCD。這些符號有其特殊含義,如黑色素瘤通常是不對稱的(Asymmetrical),它們的邊界(Borders)參差不齊,顏色(Color)呈斑塊狀,而直徑(Diameter)則超過 6 毫米。不過,Thrun 查了醫(yī)書和網(wǎng)絡上的標本后卻發(fā)現(xiàn),一些黑色素瘤的的標本并不適用于這些固定的規(guī)則。
Thrun 找了斯坦福的兩名學生幫他搞研究。學生們的首個任務就是創(chuàng)建一個“教學集”:這是一個龐大的圖片庫,機器可以通過對圖片庫的學習識別出惡性腫瘤。在網(wǎng)上搜索一番后,Esteva 和 Kuprel 找到了 18 個已經(jīng)成型的皮膚損傷圖片庫,其中包含了近 13 萬張有關痤瘡、皮疹、蟲咬、過敏反應和皮膚癌等疾病的圖片,皮膚病專家將它們分為近 2000 種疾病。值得注意的是,這些圖片庫中有一個包含 2000 個病變的集合已經(jīng)由病理學家切片檢查過了,因而它們幾乎可以算是已經(jīng)確診的了。
隨后,Esteva 和 Kuprel 開始了對系統(tǒng)的訓練,他們并沒有依據(jù)規(guī)則對其進行編程,也沒有教系統(tǒng)“ABCD”的順口熘。相反,這套系統(tǒng)只是不斷將圖像和醫(yī)生做出的診斷分類加入神經(jīng)網(wǎng)絡中。
Thrun 將這個神經(jīng)網(wǎng)絡的工作內(nèi)容描述為:“如果用一個老舊的程序去識別狗狗,軟件工程師可能會寫一千行下定義的語句,比如如果它有耳朵,一個鼻子,并有頭發(fā),且不是一只老鼠等。事實上,這并不是孩子學會辨識狗狗的方法。孩子會先通過觀察狗狗和大人的描述來學習相關的識別知識。如果她把狼當成了狗,家人會及時進行糾正,這時孩子就會改變最初的認識。機器學習算法就像小孩子,它能從已經(jīng)標注好準確信息的訓練集中汲取信息,隨后再從中汲取狗的特征,接著它會自行用成千上萬的圖片進行對比測試并最終學會識別狗狗的方法,整個過程與孩子識別狗狗完全一樣?!蓖ㄟ^這個過程,系統(tǒng)學會了“實踐知識”。
2015 年 6 月,Thrun 的團隊開始通過“驗證集”來測試機器從圖像中都學到了什么。這次測試中共包含了 1.4 萬張經(jīng)過皮膚病專家診斷的圖片(并不一定經(jīng)過活檢),機器的任務就是將這些圖像分成 3 組:良性病變、惡性病變和非癌生長。結(jié)果顯示,該系統(tǒng)的準確率達到了 72%。兩位得到認證的皮膚病醫(yī)生也一同做了測試,但他們的準確率卻只有 66%。
隨后,Thrun 師徒三人將研究擴展到了 25 位皮膚病學家,而這一次他們使用了一個黃金標準——約 2000 張經(jīng)由活檢證實的圖像“測試集”,結(jié)果顯示,醫(yī)生們完全不是機器的對手,機器沒有錯過任何一個黑色素瘤。此外它還更加精確,不會將某個腫瘤錯診斷為黑色素瘤。
“在論文中,其實還有個關于網(wǎng)絡的關鍵問題沒有重點強調(diào)?!盩hrun 說道。在第一次涉足該領域時,Thrun 的團隊用的還是個“很傻很天真”的神經(jīng)網(wǎng)絡,不過他們發(fā)現(xiàn)如果用的神經(jīng)網(wǎng)絡已經(jīng)會識別一些不相關特征(比如狗和貓),它就會學的更快也更好,也許我們的大腦也遵循類似的原理?;叵敫咧心切┝钊藷o語的枯燥訓練,如多項式因式分解、動詞變化和元素周期表,反而讓人記憶更加敏捷。
在訓練機器時,Thrun 的團隊需要對圖片進行處理。Thrun 希望有一天人們能通過智能機圖片上傳獲得精確的診斷,不過這就意味著該系統(tǒng)必須適用于多種角度和照明條件。Thrun 也有擔心,因為“在一些圖片中,黑色素瘤的部位被用黃色記號筆標注了,因此他們必須將這些部位裁剪掉,否則 Thrun 的團隊可能就是在教計算機如何識別圖中的黃色標記?!?
中研網(wǎng)是中國領先的綜合經(jīng)濟門戶,聚焦產(chǎn)業(yè)、科技、創(chuàng)新等研究領域,致力于為中高端人士提供最具權(quán)威性的產(chǎn)業(yè)資訊。每天對全球產(chǎn)業(yè)經(jīng)濟新聞進行及時追蹤報道,并對熱點行業(yè)專題探討及深入評析。以獨到的專業(yè)視角,全力打造中國權(quán)威的經(jīng)濟研究、決策支持平臺!
廣告、內(nèi)容合作請點這里:
尋求報道 ??【版權(quán)及免責聲明】凡注明"轉(zhuǎn)載來源"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多的信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。中研網(wǎng)倡導尊重與保護知識產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在內(nèi)容、版權(quán)或其它問題,
煩請聯(lián)系:jsb@chinairn.com、0755-23619058,我們將及時溝通與處理。
精彩推薦
圖片資訊
行業(yè)研究院
中國功能假肢市場動態(tài)調(diào)研及投資決策建議
功能假肢行業(yè)研究報告主要分析了功能假肢行業(yè)的市場規(guī)模
自動自行車市場投資機會及企業(yè)IPO上市環(huán)境綜合評估
2015年,滬深股市跌宕起伏,大起大落,IPO暫停數(shù)月都對I
中藥保健品市場投資機會及企業(yè)IPO上市環(huán)境綜合評估
2015年,滬深股市跌宕起伏,大起大落,IPO暫停數(shù)月都對I