《基于文獻(xiàn)的生物醫(yī)學(xué)知識發(fā)現(xiàn)方法與工具.ppt》由會員分享,可在線閱讀,更多相關(guān)《基于文獻(xiàn)的生物醫(yī)學(xué)知識發(fā)現(xiàn)方法與工具.ppt(50頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、基于文獻(xiàn)的生物醫(yī)學(xué)知識發(fā)現(xiàn)方法與工具,內(nèi)容,Swanson關(guān)聯(lián)研究及其工具 Arrowsmith 的使用 Bitola的使用 生物醫(yī)學(xué)信息檢索技巧,背景與意義,發(fā)表文獻(xiàn),研究深入,知識分裂,文獻(xiàn)量,,,,,,一、Swanson 的知識發(fā)現(xiàn)法的背景,Swanson教授認(rèn)為: (1) 客觀知識的總量與人類吸收知識的能力之間存在著巨大的差距,并且這種差距在不斷地擴(kuò)大; (2) 在信息爆炸時代,隨著科學(xué)技術(shù)的越來越專業(yè)化,跨學(xué)科的信息傳遞變得更加困難,就會產(chǎn)生知識的分裂,并且隨著知識的持續(xù)增長,這種現(xiàn)象會更加嚴(yán)重; (3) 一個專業(yè)領(lǐng)域的信息可能對另一個專業(yè)領(lǐng)域是有價值的,跨學(xué)科間一定存在著潛在的未被
2、發(fā)現(xiàn)的關(guān)聯(lián)。,非相關(guān)文獻(xiàn)的隱含關(guān)聯(lián),1985 年Swanson 在一個偶然的機(jī)會,發(fā)現(xiàn)2 篇醫(yī)學(xué)文獻(xiàn)放在一起,會揭示出一個問題的答案,而這個答案是從單獨一篇文獻(xiàn)得不到的。這預(yù)示著在醫(yī)學(xué)文獻(xiàn)中存在著大量的未被發(fā)現(xiàn)的隱含的關(guān)聯(lián)。 例如,A表示一種物質(zhì)的攝入可能導(dǎo)致一種獨特的生理改變B ,而B又作用于身體的某器官或一種疾病C。如果把兩類文獻(xiàn)放在一起,加以研究就會獲得有用的信息。即A作用于C ,而這種信息是不能根據(jù)單獨一類文獻(xiàn)得到的,稱為AB和BC這兩種文獻(xiàn)是互補(bǔ)的。,非相關(guān)文獻(xiàn)的隱含關(guān)聯(lián),一個專業(yè)領(lǐng)域的文獻(xiàn)的作者和讀者,一般并不熟知另一專業(yè)領(lǐng)域的文獻(xiàn),也就是說兩類文獻(xiàn)從沒有或很少被共同引用,并且也不
3、相互引用,我們稱這兩類文獻(xiàn)是相互獨立的,也就是非相關(guān)的。 這種情況,對兩個不同的醫(yī)學(xué)專業(yè)領(lǐng)域是經(jīng)常存在的,因此幾乎沒有人考慮到,把兩類文獻(xiàn)放在一起加以研究,也不會有人注意到A和C之間可能存在的隱含關(guān)聯(lián)。,Medline文獻(xiàn)集合,Don R. Swanson的研究,潛在的聯(lián)系,雷諾氏病 文獻(xiàn),食用魚油 文獻(xiàn),,,,血液粘稠度 紅細(xì)胞脆性,閉合式的知識發(fā)現(xiàn),閉合式知識發(fā)現(xiàn)過程是從A和C出發(fā),尋找共同的中間詞B。 Swanson開發(fā)的網(wǎng)絡(luò)應(yīng)用軟件ARROWSMITH即體現(xiàn)了閉合式挖掘這一思想。在成功預(yù)言了鎂缺乏與神經(jīng)系統(tǒng)疾?。?988年)的關(guān)系之后,Swanson又利用ARROWSMITH系統(tǒng)成功地
4、預(yù)言了消炎痛與阿爾茨海默氏癥(1996年)、雌激素與阿爾茨海默氏癥(1996年)、游離鈣磷脂酶A2與精神分裂癥(1998年)之間的關(guān)系,并發(fā)現(xiàn)了可以作為生物武器的潛在病毒(2001年)。,閉合式的知識發(fā)現(xiàn),ARROWSMITH 3.0,http://arrowsmith.psych.uic.edu,,,,,可作為生物武器的潛在病毒,能夠成為生物武器:致病性,傳播性。同時涉及到病毒這兩個特性的文章卻特別少。 A:病毒毒力遺傳方面(virulence- genetic) C:病毒疾病傳播力 病毒的昆蟲媒介傳播(insect vectors) 空氣傳播(air) 在空氣中的穩(wěn)定性(stability
5、 of viruses in air) 通過與A和C有共同聯(lián)系B找出更多符合條件的病毒。 將得到的文獻(xiàn)經(jīng)過一些系列的處理,Arrowsmith列出了三個有意義的B-LIST(病毒的集合),通過進(jìn)一步的統(tǒng)計學(xué)分析和查閱文獻(xiàn),最終找出相對有意義的病毒(B),發(fā)現(xiàn)科研機(jī)構(gòu)間潛在的合作方向,利用Arrowsmith程序,發(fā)現(xiàn)美國斯坦福大學(xué)和哥倫比亞大學(xué)在醫(yī)學(xué)信息學(xué)研究領(lǐng)域的潛在合作方向 嘗試將這種方法運(yùn)用到尋求發(fā)現(xiàn)科研機(jī)構(gòu)合作與交流的領(lǐng)域中。 結(jié)果表明,利用Arrowsmith所挖掘的科研合作與交流的內(nèi)容詳細(xì)、明確,能體現(xiàn)出研究所使用的具體方法和側(cè)重點,能更好地體現(xiàn)出兩個機(jī)構(gòu)研究內(nèi)容的相似點(可以合作
6、之處)和不同點(可以相互交流、學(xué)習(xí)之處)。,開放式知識發(fā)現(xiàn),開放式知識發(fā)現(xiàn)的過程是,對某個初始研究主題A,在MEDLINE的標(biāo)題字段檢索其相關(guān)文獻(xiàn),尋找與A在標(biāo)題中共同出現(xiàn)的中間詞B,通過篩選得到有一定意義的B,進(jìn)而重復(fù)上述過程,得到目標(biāo)詞C。 開放式挖掘初衷是從某個疾病或藥物初始,尋找疾病的潛在病因和治療方法或者藥物的潛在治療應(yīng)用。,開放式的知識發(fā)現(xiàn),BITOLA http://www.mf.uni-lj.si/bitola/,輸入單個的概念(疾病A),找到該概念的第一層相關(guān)概念并加以歸類(藥物B)。 從第一層相關(guān)概念(藥物B)出發(fā),找到它們的相關(guān)概念,并加以歸類(基因C)。 檢驗基因和疾病
7、是否有關(guān)聯(lián)。如果沒有,該基因與疾病有潛在的聯(lián)系而且并沒有文獻(xiàn)報道。 提示:與疾病、生理學(xué)反應(yīng)或者其他表型相關(guān)的新基因、藥物或者神經(jīng)科學(xué)。,BITOLA,,BITOLA:open,,BITOLA:close,,BITOLA:close,,BITOLA:close,,,,生物醫(yī)學(xué)信息檢索技巧,學(xué)術(shù)搜索引擎 Google scholar的使用 Scius的使用 Medical Matrix 網(wǎng)絡(luò)資源利用工具 Faculty of 1000 Medicine RRS的使用,Google 學(xué)術(shù)搜索,提供可廣泛搜索學(xué)術(shù)文獻(xiàn)的簡便方法。 來自學(xué)術(shù)著作出版商、專業(yè)性社團(tuán)、預(yù)印本、各大學(xué)及其他學(xué)術(shù)組織的經(jīng)同行評
8、論的文章、論文、圖書、摘要和文章。,,,,標(biāo)題 鏈接到文章摘要或整篇文章(如果文章可在網(wǎng)上找到) 引用者 提供引用該組文章的其他論文。 相關(guān)文章 查找與本組文章類似的其他論文。 圖書館鏈接(在線) 通過您已建立聯(lián)屬關(guān)系的圖書館資源找到該項成果的電子版本。在您登錄校園網(wǎng)后將自動顯示這些鏈接。 圖書館鏈接(離線) 找到藏有這項學(xué)術(shù)成果的圖書館。 同組文章 查找您可能看到的同屬這組學(xué)術(shù)研究成果的其他文章,可能是初始版本,其中有預(yù)印本、摘要、會議論文或其他改寫本。 網(wǎng)絡(luò)搜索 Google 搜索中關(guān)于該研究成果的信息。,Scirus, 綜合性最強(qiáng)的web科研工具。4.5億條記錄,不僅僅有期刊上的內(nèi)容,還
9、有科學(xué)家的主頁、課件、預(yù)印文本、專利和科研單位的收藏和網(wǎng)站信息。 由Elsevier科學(xué)出版社開發(fā)。,Scirus,覆蓋的學(xué)科范圍包括:農(nóng)業(yè)與生物學(xué),天文學(xué),生物科學(xué),化學(xué)與化工,計算機(jī)科學(xué),地球與行星科學(xué),經(jīng)濟(jì)、金融與管理科學(xué),工程、能源與技術(shù),環(huán)境科學(xué),語言學(xué),法學(xué),生命科學(xué),材料科學(xué),數(shù)學(xué),醫(yī)學(xué),神經(jīng)系統(tǒng)科學(xué),藥理學(xué),物理學(xué),心理學(xué),社會與行為科學(xué),社會學(xué)等。 每月更新,可檢索1973-2002年間發(fā)表的文獻(xiàn)。,,,生物醫(yī)學(xué)信息檢索技巧,學(xué)術(shù)搜索引擎 Google scholar的使用 Scius的使用 Medical Matrix 網(wǎng)絡(luò)資源利用工具 Faculty of 1000 Me
10、dicine RRS的使用,Medical Matrix,由美國醫(yī)學(xué)信息學(xué)會主辦,其收集的內(nèi)容專業(yè)、全面,是目前最重要的醫(yī)學(xué)專業(yè)搜索引擎。 只需在首次訪問時注冊,即可免費使用,提供了關(guān)鍵詞搜索和分類目錄,非常適合適合臨床醫(yī)師使用。 分類目錄是其主要特色,按各種醫(yī)學(xué)信息分為專業(yè)(Specialties)、疾病種類(Diseases)、臨床應(yīng)用(Clinical Practice)、文獻(xiàn)(literature)、教育(Education)、健康和職業(yè)(Healthcare and Professionals)、醫(yī)學(xué)和計算機(jī)(Medical Computing,Internet and Techno
11、logy)、市場(Marketplace)等8大類。,Medical Matrix,每一大類下再根據(jù)內(nèi)容的性質(zhì)分為新聞(News)、全文和多媒體(Full Text/MultiMedia)、摘要(Abstracts)、參考書(Textbooks)、主要網(wǎng)址(Major Sites/Home Pages)、操作手冊(Procedures)、實用指南(Practice Guidelines/FAQS)、病例(Cases)、臨床和和病理圖像(Images、Path/Clinical)、患者教育(Patient Education)、教學(xué)資料(Educational Materials)等亞類。 對鏈
12、接的網(wǎng)址按一到五個星進(jìn)行分級,并且附有簡明扼要的評論,便于使用者事先決定是否進(jìn)入其網(wǎng)頁進(jìn)一步閱讀,以節(jié)省時間。另外還提供免費的mailing list,定期發(fā)布網(wǎng)上醫(yī)學(xué)資源變化情況的通知。,,,,,,,Faculty of 1000,是一種新型的文獻(xiàn)發(fā)現(xiàn)和研究工具,由BioMed Central所出版。 由2400多位專家學(xué)者推薦,提供目前世界上最重要的生物學(xué)論文資訊及研究趨勢。提供超過1000名頂尖科學(xué)家的一致推薦。 有系統(tǒng)地組織并評價大量的科學(xué)論文信息,收錄每篇具有科學(xué)價值的文獻(xiàn),論文重要性的評論依據(jù)是其科學(xué)成就而非這些文獻(xiàn)在哪里發(fā)表。 每篇文章都包含專家所給的評論,并依據(jù)F1000 Fa
13、ctor評定文章的類別。 隨時獲得特定研究領(lǐng)域中最重要的論文信息;提供作者同行針對單一論文的即時評價,期刊之影響因子則對此直接評價提供重要的補(bǔ)充評價。,,,,,,,,,RSS,RSS Really Simple Syndication Rich Site Summary RDF Site Summary 是一種描述和同步網(wǎng)站內(nèi)容的格式。一種方便的信息獲取工具。,RSS可以干什么,RSS獲取信息的模式與加入郵件列表(如電子雜志和新聞郵件)獲取信息有一定的相似之處,也就是可以不必登錄各個提供信息的網(wǎng)站而通過客戶端瀏覽方式(稱為“RSS閱讀器”)或者在線RSS閱讀方式這些內(nèi)容。例如,通過一個RSS閱
14、讀器,可以同時瀏覽新浪新聞,也可以瀏覽搜狐或者百度的新聞。,RSS可以干什么,訂閱BLOG:訂閱與你有共同愛好的作者的Blog; 訂閱新聞; 訂閱期刊和PubMed上的相關(guān)記錄:你可以訂閱你工作中所需的技術(shù)文章。 你再也不用一個網(wǎng)站一個網(wǎng)站,一個網(wǎng)頁一個網(wǎng)頁去逛了。只要這將你需要的內(nèi)容訂閱在一個RSS閱讀器中,這些內(nèi)容就會自動出現(xiàn)你的閱讀器里,你也不必為了一個急切想知道的消息而不斷的刷新網(wǎng)頁,因為一旦有了更新,RSS閱讀器就會自己通知你!,RSS的使用,使用RSS獲取信息的前提是,先安裝一個RSS閱讀器,然后將提供RSS服務(wù)的網(wǎng)站加入到RSS閱讀器的頻道即可。大部分RSS閱讀器本身也預(yù)設(shè)了部分RSS頻道,如新浪新聞、百度新聞等。,RSS的使用,在許多新聞信息服務(wù)類網(wǎng)站,會看到按鈕,有的網(wǎng)站使用一個圖標(biāo),有的同時使用兩個,這就是典型的提供RSS訂閱的標(biāo)志,這個圖標(biāo)一般鏈接到訂閱RSS信息源的URL。當(dāng)然,即使不用這樣的圖標(biāo)也是可以的,只要提供訂閱RSS信息源的URL即可。,本課程學(xué)習(xí)的重點,數(shù)據(jù)挖掘的定義 數(shù)據(jù)挖掘分類 數(shù)據(jù)挖掘的過程 數(shù)據(jù)挖掘的算法(2種) 聚類與分類 共現(xiàn)、同被引、引文耦合 可共現(xiàn)分析的字段,說明問題 實習(xí)過程(數(shù)據(jù)挖掘的過程),