公務員期刊網(wǎng) 精選范文 生物信息學概念范文

生物信息學概念精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的生物信息學概念主題范文,僅供參考,歡迎閱讀并收藏。

生物信息學概念

第1篇:生物信息學概念范文

1 正確的學習態(tài)度――物理學習觀的前提

在傳統(tǒng)的物理教學模式、物理學習方式的驅(qū)動下,多數(shù)高中學生對物理教師有依賴心理,表現(xiàn)為學習不主動,缺乏濃厚的學習興趣,上課前等老師來、課堂上等老師講、下課等老師布置作業(yè)等等,這種學習態(tài)度與新課改要求格格不入,是不正確的學習態(tài)度,新課改倡導學生積極主動學習、主動發(fā)展,凸顯學生的主體地位。因此,高中生應該主動投入到物理學習的過程中,始終保持良好的學習態(tài)度,主動參與到學習中。

“頭腦是需要被點燃的火把”,這也給我們物理教學和物理學習提出了培養(yǎng)學生正確的學習觀,形成正確的學習態(tài)度的必要性。同時心理學研究也表明:在老師的引領下看書學習和聽老師講,學生學會的知識只是所占所學知識的最多是15%,而自己主動探討、親身經(jīng)歷的內(nèi)容則可以達到80%以上。從這一理論來說,老師在多個層面調(diào)動學生學習物理的內(nèi)驅(qū)力,讓他們以積極地心態(tài)學習高中物理,親身經(jīng)歷學習過程,改變被動的方式,積極投入到物理學習中,為高中物理學習成績的提高,邁開堅實的一步。

2 找到學習支點――物理學習觀的基礎

如果將物理學習比作高樓大廈的建筑,支點也就是建筑高樓的腳手架,那么,腳手架搭在哪兒最合適,無疑是關鍵問題。對于高中物理來說,支點問題就是物理的知識點的理解和物理規(guī)律的掌握。

物理學科是實踐性比較強的學科之一,物理概念和物理規(guī)律等都有“物”的基礎,應重視其得出的全過程,知其然知其所以然,學會追根朔源,否則,忽略了物理的“理”,想學好物理就是天方夜譚。

因此,教學中,應該引導學生從記憶概念、背誦規(guī)律、題海戰(zhàn)術中走出來,否則,做一道題記住一道題的解法,沒做過的見到就束手無策,使知識和應用支離破碎。如果每一道習題都能認真分析,明確求解過程的依據(jù),清楚物理的概念和物理規(guī)律的理解和運用,逐漸形成獨立解決問題的能力,再碰到“生題”時,能快速找到問題的切入點,“生題”也就不“生”了。比如在力學問題中,滑動摩擦力是重點,它與兩個相接觸的物體間的彈力的方向垂直大小成正比。而彈力是被動力力,它的大小與物體的運動情況和其它受力情況有關,通常由此方向的運動情況用牛頓第二定律解出。如果運動情況或者其它受力情況發(fā)生變化,彈力的大小都會發(fā)生變化,甚至方向都會變?yōu)榉聪?。由于彈力的變化進而引起滑動摩擦力的變化,改變了平行于接觸面的運動情況。在這些概念規(guī)律和方法掌握后此類問題基本能夠迎刃而解。

3 構(gòu)建知識體系――物理學習觀的核心

物理知識包括物理現(xiàn)象、概念、規(guī)律和物理方法,老師指導學生構(gòu)建知識體系,可以采用以線串點的思路。高中物理研究力和運動的關系是其中一條主線,主線上有三條支線,分別是力、運動和反應兩者之間關系的規(guī)律。第一條支線線上有五種性質(zhì)力,分別是重力、彈力、摩擦力、電場力和磁場力,主要各自產(chǎn)生機理、大小和方向、相互關系和特點。第二條支線主要有三個描述參量:位移、速度和加速度,幾個典型的運動:勻速直線運動、勻加速直線運動、(類)拋體運動、圓周運動和簡諧運動,弄清各自運動參量隨時間變化的規(guī)律等。第三條支線有牛頓定律、動能定理和守恒定律等。幾條主線再構(gòu)建成網(wǎng)絡,這樣物理知識體系就初步建立。當然完整的體系建立還需做大量的其它工作,但學生只要有了這種意識并開始實施并取得了階段性成果,他們一定樂于這項工作,其實從某種意義上說我們更需要這個過程。布魯納就把結(jié)構(gòu)的重要性放在首位,他強調(diào)指出:“不論我們選教什么學科,務必使學生理解該學科的基本結(jié)構(gòu)?!辈剪敿{的這一思想道出了構(gòu)建知識體系的重要性。

4 明確思路和方法――物理學習觀的關鍵

笛卡兒的“最有價值的知識是方法的知識”說出了方法和思路的重要性。物理學板塊不是很多,每一個版塊思路和方法都不同,比如在力學和電磁學中主體內(nèi)容是研究力和運動的關系。解決這類問題有兩種觀點:一是力和運動的觀點,在直線運動中運用牛頓第二定律和運動學公式解決,在曲線運動中,拋體運動和類拋體運動運用分解的方法轉(zhuǎn)化為直線運動處理。圓周運動的運動學公式主要是向心加速度的公式。二是功和能的觀念。主要涉及兩種能量:動能和勢能。兩個功能關系:一是重力、彈力和電場力等保守力做功等于對應的勢能的減少量,二是外力的總功等于質(zhì)點動能的增加。這兩種思路相輔相成,在中學階段,有些問題由兩種思路都能找的解決問題的方法,此時就有方法優(yōu)劣的甄別的問題。有些只能由一個觀點出發(fā)得出解決問題的辦法。

如果在解決力和運動的問題時,沒有這些方法作指導,做題時務必出現(xiàn)思路枯竭,對題束手無策,望洋生嘆之感便會油然而生。相反,如果掌握了科學的方法,可以舉一反三,將這些方法和思路納入一定的軌道,便可以快速找到解決問題的途徑,從而解決問題技能進一步提高。

第2篇:生物信息學概念范文

關鍵詞:新課改 ;探究實驗; 發(fā)現(xiàn)問題

物理實驗在物理教學中占有重要的地位,它既是物理教學的基礎,也是物理教學的內(nèi)容、方法、手段,在新課程標準的物理教學中倡導學生自主學習、研究性學習,加強科學探究《課程標準》第三部分專門列入一項――科學探究及物理實驗能力要求,列表說明探究要素和基本要求,所以實驗在物理教學中的地位不但沒有削弱,還大大加強了,因為實驗能為學生的自主學習、科學探究打下基礎,又能為學生的自主學習、科學探究提供物質(zhì)的保證,在學生智能結(jié)構(gòu)的發(fā)展中占有重要的地位 。本人就探究性物理實驗教學在高中年級進行了初步的嘗試與探索,淡幾點實踐中的體會.

一、物理探究性學習活動方式

高中物理探究性學習活動的開展方式是多種多樣的。 以物理規(guī)律為主的探究活動的基本過程是:通過對實驗現(xiàn)象的觀察,或應用已知規(guī)律、理論對某一現(xiàn)象進行邏輯推理,找出一些問題,然后設計實驗,采集實驗數(shù)據(jù),對實驗數(shù)據(jù)進行分析歸納,最終得到規(guī)律性的結(jié)論。如高一、高二年級的學生可以探究的小課題有:用傳感器探究影響摩擦力大小的因素、探究單擺的周期與哪些因素有關、探究碰撞中的能量問題、光在界面發(fā)生折射時遵從什么規(guī)律、如何查找電路故障、氣墊上彈簧振子的周期與質(zhì)量、勁度的關系等。

二、探究性物理實驗需注意的兩個問題

1. 實驗設計要具有探究性

考察我們當前的實驗教學的現(xiàn)狀發(fā)現(xiàn),不少課堂上,學生們也在忙于收集數(shù)據(jù),解釋并求證結(jié)果,但是如何根據(jù)有限的線索確定證據(jù)收集的方向,如何在不止一個可能合理的解釋面前做出決策呢?這對于學生至關重要,但這個環(huán)節(jié)常常被教師替代.缺乏真正意義上的探究。因此,實驗設計要具有探究性是指:所設計的實驗包含的物理規(guī)律往往隱藏在較深的層次,需要學生去挖掘。實驗的條件和結(jié)果之間往往存在較大的距離,需要學生去跨越。解決問題的方法與途徑往往不太明確.需要學生通過嘗試錯誤,得出假設并驗證假設來尋找。

2.探究性實驗教學設計要在內(nèi)容上把握主干,形式上注重質(zhì)量

長期以來,我們重視知識的傳授而忽視了能力培養(yǎng).注重知識的結(jié)果,往往淡化甚至不管知識獲得的過程。教育太急于看到知識傳授的結(jié)果,太講究“效率”了。因此.很多教師用“高效益”的方式將實驗的結(jié)果得出的規(guī)律告訴學生。然后把大量的時間用于反復通過習題訓練理解掌握規(guī)律,但這樣做恰恰是本末倒置的。對于學生還不是很理解的規(guī)律,即使是通過大量的習題反復演練.其知識的遷移能力仍是比較弱的,一旦出現(xiàn)新的情境.許多學生將束手無策。

實驗小組活動的開展,保持了學生對自然界的好奇心,增強了學生對科學實驗探究的興趣,許多同學在活動中始終有一種興奮感、滿足感,激發(fā)了學生質(zhì)疑和探究的興趣。我們感到許多學生學習物理的勁頭提高了,喜愛物理學科的人數(shù)更多了,某些所謂的“差生”也在實驗活動中嶄露頭角,使得其他同學刮目相看。問問題的人多了,學生的分析和觀察能力提高了,學生中常常可以看到為了某一個物理問題許多人為它爭論,學生間的交流多了,相互合作多了,關系更融洽了,更自信更富于挑戰(zhàn)了。課外小制作、小發(fā)明是物理實驗整體探究性學習的重要途徑,這種活動分為驗證性小制作和探究性小發(fā)明。即使是驗證性的小制作,它制作的過程本身就是一種探究性的活動。這種探究性的活動,對培養(yǎng)學生的興趣和特長具有重要意義,并能為學生今后的創(chuàng)造活動奠定良好的基礎。為避免實驗制作的盲目性,事先應制訂好目標,保證有充足的時間討論設計可行的實驗方案,學生可以小組為單位,在完成實驗方案后進行交流取長補短,再次討論修改實驗方案,拿出可行的實驗方案可進行制作實驗。值得注意的是在小制作、小發(fā)明完成后,教師千萬不能忽視對學生作品的評價,學生為自己制作或發(fā)明出的作品喜悅的同時更希望其他同學老師一同分享他的快樂,教師及時的評講或評比,既給學生一種滿足感,又能夠自然巧妙地指出作品中的不足,充分突出了學生的主體性和教師的主導性作用,探究性活動的開展,學生的觀察能力,思辨能力,捕捉有用信息的能力、應用物理知識解決具體問題的能力有了很大的提高。

第3篇:生物信息學概念范文

關鍵詞: 生物信息學;高等數(shù)學;教學效果; 教學方法; 多媒體

生物信息學是綜合計算機科學、 信息技術和數(shù)學的理論和方法來研究生物學信息的交叉學科。數(shù)學作為生物信息學研究的基本工具, 已經(jīng)成為生物信息學專業(yè)的必修課程。高等數(shù)學是大學數(shù)學的基礎課程, 通過高等數(shù)學的學習, 學生不僅可以掌握基本的數(shù)學概念, 公式及方法, 更可以提高自己的邏輯能力以及運用數(shù)學解決生物信息學問題的能力。因而高等數(shù)學教學效果的好壞, 直接影響到一個學校, 一門學科人才的培養(yǎng), 進而會影響到我國的科技發(fā)展水平與現(xiàn)代化進程。筆者結(jié)合此領域教師們多年的教學實踐, 結(jié)合生物信息學的專業(yè)特點從課前、 課上、 課后三個方面闡述提高高等數(shù)學教學效果的幾點建議。

1做好充分的課前準備,有的放矢。

要想在有限的課堂時間內(nèi)達到最好的教學效果,教師首先需要在課前認真?zhèn)湔n, 尤其要注意重點內(nèi)容的強調(diào)以及知識點的銜接, 使得一次課成為一部完整的電影, 而不是多個場景的組合。同時, 由于生物信息學是一門快速發(fā)展的交叉科學, 因此在授課的過程中教師應當將生物信息學的前沿發(fā)展動態(tài)與課程內(nèi)容進行合理的融合, 這就需要教師在課前閱讀大量的科研文獻, 做到教學科研一體化。此外, 還要精心制作課件, 好的課件不僅要字體大小適中, 背景美觀而不雜亂, 又要適當?shù)募右恍┯腥さ膭赢?。對于高等?shù)學這樣一門相對枯燥的學科, 小小的動畫會讓學生的精神為之一振, 間接提高教學效果。同時要做到內(nèi)容簡潔明了, 真正起到提綱挈領的作用。對于高等數(shù)學下冊來說, 課件的制作尤為重要。比如, 第一型曲面積分概念的引入, 不僅需要有準確的三維圖像, 而且引入概念的過程也要提綱式地逐條列出, 使學生清晰地了解一個抽象的數(shù)學概念是怎樣產(chǎn)生的。

2多方位開展課上教學實踐。

2.1 多媒體與板書結(jié)合

多媒體的出現(xiàn)為高等數(shù)學的教學帶來了極大方便。比如曲線與曲面積分的章節(jié)中, 很多問題都需要結(jié)合三維圖像來解答, 在黑板上畫立體圖形既浪費時間, 又很難畫得準確, 而利用多媒體則只需在課件中插入相應的三維圖像就可以了。還有一些冗長的概念或公式, 用多媒體展示一目了然, 省時省力。多媒體雖然為教學帶來了諸多方便, 但它并不能完全代替板書。比如, 具體的解題過程如果只寫在課件上, 那么學生就只是觀眾, 在觀看一道題怎么解答。而利用板書引導學生,在書寫每一步的時候讓學生思考下一步應該怎么做, 那么學生就是參與者了。定理或公式的推導也是同樣的道理。所以上課時要做到多媒體與板書的有機結(jié)合, 多媒體展示提綱和圖像, 板書書寫具體的解題和推導過程。

2.2 重視基礎知識的教學

要狠抓以基本概念、 基本理論、 基本方法為主的“ 三基” 教學。高等數(shù)學雖然看起來很難, 但它實際上是由很多基本概念和理論方法交織而成的。只有牢固地掌握基礎知識, 才能理解數(shù)學的精髓, 才能熟練的運用這些知識來解決復雜的生物信息學問題。對于基本概念, 要用盡可能通俗的, 形象的語言或直觀的圖像來解釋, 必要的時候也可以用實物演示。比如, 莫比烏斯帶的定義是單側(cè)曲面, 這個概念用語言很難形容, 但如果用一張紙條演示一下, 學生就完全理解了。對于基本定理, 一定要在黑板上寫下詳細的推導過程, 讓學生了解怎樣從一些已有的知識推導出一個新的結(jié)論, 這樣學生就不是在死記硬背定理的內(nèi)容, 而是真的學會了。對于基本方法, 則要讓學生反復練習, 熟能生巧, 多做練習還會提高學生的計算能力。

2.3 注重課堂練習

在課堂上要堅持" 教師是主導, 學生是主體" 的教學原則,要做到精講多練、 勤練。每堂課都可能會講多個知識點, 多種類型題, 如果一味的填鴨式教學, 學生往往只是“ 懂了” , 而不是“ 會了” 。所以在每一道類型題講完之后, 要立刻找一道相似的題目, 給學生一定的時間讓學生自己練習, 及時消化和掌握所學的知識, 并且要重視理論聯(lián)系實際, 將數(shù)學的知識應用到具體的生物信息學研究中去。比如, 介紹了矩陣的概念之后, 就可以向?qū)W生介紹基因芯片的制備、 基因表達譜的數(shù)據(jù)格式等內(nèi)容, 將基因芯片檢測的全基因組范圍的基因表達信息用矩陣表示出來了, 矩陣的每一行代表一個基因在所有芯片實驗中的表達水平, 每一列代表在同一張芯片上所有基因的表達值, 這樣從一個矩陣就可以觀察到不同條件下每一個基因的表達變化了。除了每堂課都要讓學生有一定的練習之外, 在每一章或者每一個大問題結(jié)束之后還要開設習題課。在習題課上, 教師首先要總結(jié)這一部分所學的重要知識點以及它們之間的聯(lián)系, 使學生在思維中形成一個完整有機的知識體系, 整體的把握知識框架, 這比掌握零散的知識點更有效。其次, 對本部分每一種重點的類型題都找一兩道類似的題目講解, 使學生在記憶開始模糊的時候重新回憶起來, 從而牢固地掌握本部分內(nèi)容, 為開始新的篇章打好基礎。

2.4 建立和諧的師生關系

高等數(shù)學是一門相對較難的學科, 學生在學習起來比較吃力, 這樣就容易形成逆反心理, 因此建立和諧的師生關系是達到良好教學效果的必要條件。首先, 師生之間是平等的,聞道有先后, 術業(yè)有專攻而已。這就要求教師在上課的時候不要高高在上, 要多多與學生交流, 在每一個知識點過后及時詢問學生是否理解, 如果沒理解就再講一遍。課下也同樣要走入到學生中去, 及時解答他們的問題, 還可以跟學生談一些與課程無關的東西, 拉近與學生的距離。只有切身體驗到他們的感受和需求才能更好的完成教與學的任務。

3 通過課后的練習鞏固高等數(shù)學課上所學的知識

根據(jù)艾賓浩斯遺忘曲線, 如果只是上課記住了, 課下就不再復習,那么所掌握的內(nèi)容就會迅速遺忘。所以, 適量的課后作業(yè)是非常必要的, 幾道習題幾十分鐘就可以起到鞏固知識的作用。同時, 教師也可以根據(jù)自身的科研方向, 設計一些小的科研課題, 鼓勵和引導學生進行思考, 如何利用學到的高等數(shù)學知識去解決實際的生物信息學問題。此外, 教師對n后作業(yè)的批改同樣重要, 通過對每一份作業(yè)的仔細批閱, 找出學生犯錯的共性和個性問題, 在下堂課著重講解, 那么學生再遇到類似問題時就不會犯同樣的錯誤了。同時還要對做的好的學生給予表揚和鼓勵。

高等數(shù)學作為生物信息學專業(yè)的必修基礎課, 其教學效果的好壞直接影響到生物信息學人才的培養(yǎng)以及學科的建設, 而要提高高等數(shù)學的教學效果, 就要做到課前認真?zhèn)湔n,課上利用多媒體與板書結(jié)合的教學手段, 重視基礎內(nèi)容的教學與練習, 同時活躍課堂氣氛, 保持和諧的師生關系, 并在課后布置適量的課后作業(yè)。

參考文獻:

[1] 張紅梅.提高高等數(shù)學教學效果的幾點見解.赤子,2009,4:45

[2] 孫嘯,陸祖宏,謝建明.生物信息學基礎.第1版.北京: 清華大學出版社,2005.286-287.

第4篇:生物信息學概念范文

關鍵詞 生物信息學 教學改革 醫(yī)學 教學模式

中圖分類號:Q811-4 文獻標識碼:A

21世紀是生命科學的世紀,人類及模式生物基因組計劃的全面實施,使分子生物學數(shù)據(jù)以爆炸性速度增長。面對基因組學、蛋白質(zhì)組學、基因芯片、分子進化等大量的生物信息,在計算機科學、網(wǎng)絡技術以及生物分析技術的相互作用和滲透下,誕生了一門嶄新的學科――生物信息學(Bioinformatics)。生物信息學利用計算機和互聯(lián)網(wǎng),以數(shù)據(jù)庫為載體,運用數(shù)學算法和計算模型,研究生物信息數(shù)據(jù)的獲取、處理、存儲、分發(fā)、分析和解釋等方面,進而闡明和解釋龐雜的生物數(shù)據(jù)所蘊含的意義。生物信息學跨越了整個生命科學領域,近年來在醫(yī)藥學研究中發(fā)揮了不可替代的作用,無論是從分子生物學的角度闡述病因,還是對疾病的預防、診斷、治療與新藥研發(fā)都將產(chǎn)生巨大的推動作用,醫(yī)學生物信息學必然在未來的醫(yī)學研究中處于關鍵地位,但生物信息學的理工科特性決定了該課程在醫(yī)學教育中開展的難度。本文結(jié)合醫(yī)學院校特色和生物信息學課程特點,探討開設醫(yī)學生物信息學課程的必要性,分析生物信息學課程在教學實踐中存在的問題,提出本校開展生物信息學教學的實施方法。

1 醫(yī)學生物信息學的主要研究內(nèi)容

1.1 疾病基因的發(fā)現(xiàn)與鑒定

約有6000種以上的人類疾患與特異基因的改變有關,某些關鍵性基因或其產(chǎn)物的結(jié)構(gòu)功能異常,可以直接或間接地導致疾病的發(fā)生。使用基因組信息學的方法通過超大規(guī)模計算是發(fā)現(xiàn)新基因的重要手段。例如:通過構(gòu)建腫瘤cDNA文庫或表達序列標簽(expression sequence tag,EST)分析差異表達基因,揭示腫瘤發(fā)生的分子水平變化,尋找靶基因。

1.2 藥物設計與新藥研發(fā)

生物信息技術為藥物研究、設計提供了嶄新的研究思路和手段。利用數(shù)據(jù)資料、軟件工具篩選藥物作用的靶位和候選基因,闡明其結(jié)構(gòu)和功能關系,指導設計能激活或阻斷生物大分子發(fā)揮其生物功能的治療性藥物。

生物信息藥物設計常用的方法有:①三維結(jié)構(gòu)搜尋,尋找符合特定性質(zhì)和三維結(jié)構(gòu)的分子,從而發(fā)現(xiàn)合適的藥物分子。②分子對接,建立大量化合物的三維結(jié)構(gòu)數(shù)據(jù)庫,依次搜索小分子配體使其與受體的活性位點結(jié)合,通過優(yōu)化使得配體與受體的形狀和相互作用最佳匹配。③全新藥物設計,利用計算機自動設計出與受體活性部位的幾何形狀和化學性質(zhì)相匹配的結(jié)構(gòu)新穎的藥物分子。

生物信息學方法為藥物研制提供了更多的、潛在的靶標,大大減少藥物研發(fā)的成本,提高研發(fā)的質(zhì)量和效率。

1.3 流行病學研究中的應用

將流行病學的遺傳和非遺傳性的研究與生物信息學結(jié)合起來,會對疾病的機理、個體對某種疾病的易感性和疾病在群體中的分布有更明確的認識,對疾病的預防和治療有極大的指導意義。

2 醫(yī)學生物信息學課程的特點及主要困難分析

2.1 課程內(nèi)容豐富,學科交叉,數(shù)據(jù)龐雜

生物信息學利用生物學,計算機科學和信息技術揭示大量復雜的生物數(shù)據(jù)所賦有的生物學奧秘,是一門交叉性學科,并且理科特性很強,需要深入理解分析。目前生物信息學包含了基因組、蛋白質(zhì)組、代謝及藥物等多個部分,每個部分都具有各自的特色和相應的分析技術。根據(jù)《Nucleic Acids Research》統(tǒng)計,全球共有約1000多個主要的生物醫(yī)學數(shù)據(jù)庫,涵蓋了生物醫(yī)學研究的諸多領域。學生不僅要掌握獲取和利用海量生物信息的基本知識和技術,還應掌握相關的數(shù)學、物理學、計算機程序設計等知識和技術,又因為醫(yī)學專業(yè)學生的數(shù)理知識有限,學習起來有一定的困難。

2.2 操作性和實踐性強

生物信息學是一門操作性和實踐性很強的學科,主要是在互聯(lián)網(wǎng)環(huán)境中,依靠計算機,利用數(shù)據(jù)庫和各種信息處理軟件來進行生物信息學方面的分析工作。針對醫(yī)學專業(yè)學生開設生物信息學課程,其教學內(nèi)容應注重理論與實踐緊密結(jié)合,著重學習利用計算機對各種生物信息資源和數(shù)據(jù)庫的檢索,使用方法與技巧,真正做到學有所用。

2.3 現(xiàn)狀與困難分析

目前,國內(nèi)的生物信息學教學基本沿用以“教師講授為主”的傳統(tǒng)教學模式,與生物信息學交叉前沿性特點不相適應,實驗教學單一,多為驗證性試驗,缺乏綜合性和設計性。此外,醫(yī)學專業(yè)學生計算機知識薄弱,對生物信息學的算法與數(shù)據(jù)庫的原理和特點等不甚了解,在高通量數(shù)據(jù)處理面前力不從心,影響對問題的分析能力。

3 醫(yī)學生物信息學課程開設實施方法和對策

3.1 根據(jù)醫(yī)學專業(yè)特點設計教學內(nèi)容,建立具有模塊化的教學大綱

目前尚未形成系統(tǒng)、成熟的生物信息學教學模式。開設課程之前,對醫(yī)學專業(yè)學生進行問卷調(diào)查,讓他們選擇醫(yī)學生物信息學課程中感興趣的、需要學習的知識內(nèi)容,并提出難點問題。教師匯總問卷結(jié)果,對授課內(nèi)容進行調(diào)整,建立模塊化的教學大綱,例如:導論模塊、數(shù)據(jù)庫及使用模塊、基因組信息學及其分析方法模塊、蛋白質(zhì)組生物信息學模塊、代謝和藥物生物信息學及系統(tǒng)生物學模塊等,使學生清楚每個模塊的特點和作用,提高學生的學習興趣,激發(fā)學生的學習熱情。

3.2 強化實驗教學,激發(fā)學生的創(chuàng)新思維和創(chuàng)新意識

生物信息學的學習是運用生物醫(yī)學、數(shù)學、以及計算機科學等諸多學科知識進行分析、判斷、推理、綜合的實踐過程,強化實驗教學顯得尤為重要。另外,采用PBL(Problem Based Learning)教學法,可以有效地激發(fā)學生的創(chuàng)新思維和創(chuàng)新意識。

3.2.1 注重實驗操作

生物信息學實驗課程以計算機操作為主,需要學生靈活應用互聯(lián)網(wǎng)、數(shù)據(jù)庫和多種生物信息學軟件,所以實驗操作顯得尤為重要,加大實驗比例,為學生提供較多的實驗操作機會,不僅提高了學生的動手能力,而且大大提高了學生在因特網(wǎng)環(huán)境下對生物大分子序列、生物大分子結(jié)構(gòu)進行生物信息學分析的能力,是提高學生學習生物信息學效果的有力保障。

3.2.2 采用PBL教學模式,優(yōu)化實驗內(nèi)容

加大設計性實驗的比例,采用PBL教學法,根據(jù)學生能力和興趣進行分組,由教師提出問題并布置真實性任務,使學生在已有的知識基礎上,通過查找文獻、小組討論、探索,最終完成任務,寫出試驗報告。由教師對任務完成過程及結(jié)果進行點評,對學生掌握知識的程度及學生的科研、應用能力進行評價,并提出進一步的提高方向。學生在實驗操作的過程中,不斷地發(fā)現(xiàn)問題、解決問題,有效地激發(fā)了學生的創(chuàng)新思維和創(chuàng)新意識。

3.3 改革教學方法,革新考核方式

3.3.1 結(jié)合多媒體技術與雙語教學

多媒體技術教學靈活生動,教師在講授難于理解的概念和生物信息學工具時,可以直接打開相關軟件和網(wǎng)站進行演示,使抽象的生物信息學知識以具體的、動態(tài)的形式展現(xiàn)出來,從而加深學生對課程的掌握程度。此外,生物信息學涉及到的數(shù)據(jù)庫、網(wǎng)站、應用軟件多為英文界面,所以雙語授課顯得尤為重要,教師可借助多媒體,對課程進行中英整合講解。

3.3.2 結(jié)合科研實例進行教學

生物信息學是一門不斷完善和發(fā)展的學科,數(shù)據(jù)庫的更新、相關軟件的升級、算法的優(yōu)化等,通常會隨著科研中遇到的生物學問題變化而變化,所以教師可以結(jié)合現(xiàn)階段的科研背景和具體的研究方向,結(jié)合實例進行教學,可以讓學生真正掌握利用生物信息學方法解決生物學問題的思路,并培養(yǎng)和提高學生的科學思維能力,使學生由知識的被動接受者變?yōu)橹R的主動發(fā)現(xiàn)者、探究者,教師則由知識的傳授者轉(zhuǎn)變?yōu)榻虒W活動的指導者、組織者。

3.3.3 采用無紙化考核方式

適當降低課程理論難度,減少不必要的數(shù)學理論推導,注重實際應用、解決問題能力的培養(yǎng),通過上機實踐操作,考核學生對基本知識和原理的掌握情況,克服傳統(tǒng)的死記硬背現(xiàn)象。

4.結(jié)語

生物信息學作為一門交叉學科,發(fā)揮了其獨特的橋梁作用,已經(jīng)廣泛地滲透到醫(yī)學的各個研究領域。本文針對開設醫(yī)學生物信息學課程的必要性和教學模式進行了探討,以提高學生學習的自主性、實際操作能力和解決問題的應用能力為目標,不斷改進教學手段、加強教學過程的趣味性,以期培養(yǎng)綜合型的、高素質(zhì)、現(xiàn)代化醫(yī)學人才。

參考文獻

[1] 伍欣星,趙.生物信息學基礎與臨床醫(yī)學應用指南[M].北京:科學出版社,2005.

[2] 張陽德.生物信息學[M].北京:科學出版社,2009.

[3] WeiLi-ping,YuJun.BioinformaticsinChina:APersonalPerspective[J].PlosComputationalBiology,2008,4(4):e1000020.

[4] 汪凡軍,張楚瑜.生物信息學在醫(yī)學上的應用[J].國際檢驗醫(yī)學雜志,2006,27(2).

第5篇:生物信息學概念范文

關鍵詞: 生物信息學 農(nóng)業(yè)研究領域 應用

“生物信息學”是英文單詞“bioinformatics”的中文譯名,其概念是1956年在美國田納西州gatlinburg召開的“生物學中的信息理論”討論會上首次被提出的[1],由美國學者lim在1991年發(fā)表的文章中首次使用。生物信息學自產(chǎn)生以來,大致經(jīng)歷了前基因組時代、基因組時代和后基因組時代三個發(fā)展階段[2]。2003年4月14日,美國人類基因組研究項目首席科學家collins f博士在華盛頓隆重宣布人類基因組計劃(human genome project,hgp)的所有目標全部實現(xiàn)[3]。這標志著后基因組時代(post genome era,pge)的來臨,是生命科學史中又一個里程碑。生物信息學作為21世紀生物技術的核心,已經(jīng)成為現(xiàn)代生命科學研究中重要的組成部分。研究基因、蛋白質(zhì)和生命,其研究成果必將深刻地影響農(nóng)業(yè)。本文重點闡述生物信息學在農(nóng)業(yè)模式植物、種質(zhì)資源優(yōu)化、農(nóng)藥的設計開發(fā)、作物遺傳育種、生態(tài)環(huán)境改善等方面的最新研究進展。

1.生物信息學在農(nóng)業(yè)模式植物研究領域中的應用

1997年5月美國啟動國家植物基因組計劃(npgi),旨在繪出包括玉米、大豆、小麥、大麥、高粱、水稻、棉花、西紅柿和松樹等十多種具有經(jīng)濟價值的關鍵植物的基因圖譜。國家植物基因組計劃是與人類基因組工程(hgp)并行的龐大工程[4]。近年來,通過各國科學家的通力合作,植物基因組研究取得了重大進展,擬南芥、水稻等模式植物已完成了全基因組測序。人們可以使用生物信息學的方法系統(tǒng)地研究這些重要農(nóng)作物的基因表達、蛋白質(zhì)互作、蛋白質(zhì)和核酸的定位、代謝物及其調(diào)節(jié)網(wǎng)絡等,從而從分子水平上了解細胞的結(jié)構(gòu)和功能[5]。目前已經(jīng)建立的農(nóng)作物生物信息學數(shù)據(jù)庫研究平臺有植物轉(zhuǎn)錄本(ta)集合數(shù)據(jù)庫tigr、植物核酸序列數(shù)據(jù)庫plantgdb、研究玉米遺傳學和基因組學的mazegdb數(shù)據(jù)庫、研究草類和水稻的gramene數(shù)據(jù)庫、研究馬鈴薯的pomamo數(shù)據(jù)庫,等等。

2.生物信息學在種質(zhì)資源保存研究領域中的應用

種質(zhì)資源是農(nóng)業(yè)生產(chǎn)的重要資源,它包括許多農(nóng)藝性狀(如抗病、產(chǎn)量、品質(zhì)、環(huán)境適應性基因等)的等位基因。植物種質(zhì)資源庫是指以植物種質(zhì)資源為保護對象的保存設施。至1996年,全世界已建成了1300余座植物種質(zhì)資源庫,在我國也已建成30多座作物種質(zhì)資源庫。種質(zhì)入庫保存類型也從單一的種子形式,發(fā)展到營養(yǎng)器官、細胞和組織,甚至dna片段等多種形式。保護的物種也從有性繁殖植物擴展到無性繁殖植物及頑拗型種子植物等[6]。近年來,人們越來越多地應用各種分子標記來鑒定種質(zhì)資源。例如微衛(wèi)星、aflp、ssap、rbip和snp等。由于對種質(zhì)資源進行分子標記產(chǎn)生了大量的數(shù)據(jù),因此需要建立生物信息學數(shù)據(jù)庫和采用分析工具來實現(xiàn)對這些數(shù)據(jù)的查詢、統(tǒng)計和計算機分析等[7]。

3.生物信息學在農(nóng)藥設計開發(fā)研究領域中的應用

傳統(tǒng)的藥物研制主要是從大量的天然產(chǎn)物、合成化合物,以及礦物中進行篩選,得到一個可供臨床使用的藥物要耗費大量的時間與金錢。生物信息學在藥物研發(fā)中的意義在于找到病理過程中關鍵性的分子靶標、闡明其結(jié)構(gòu)和功能關系,從而指導設計能激活或阻斷生物大分子發(fā)揮其生物功能的治療性藥物,使藥物研發(fā)之路從過去的偶然和盲目中找到正確的研發(fā)方向。生物信息學為藥物研發(fā)提供了新的手段[8,9],導致了藥物研發(fā)模式的改變[10]。目前,生物信息學促進農(nóng)藥研制已有許多成功的例子。itzstein等設計出兩種具有與唾液酸酶結(jié)合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者與唾液酸酶的結(jié)合活性的250倍[11]。目前,這兩種新藥已經(jīng)進入臨床試驗階段。tang sy等學者研制出新一代抗aids藥物saquinavir[12]。pungpo等已經(jīng)設計出幾種新型高效的抗hiv-1型藥物[13]。楊華錚等人設計合成了十多類數(shù)百個除草化合物,經(jīng)生物活性測定,部分化合物的活性已超過商品化光合作用抑制劑的水平[14]。

現(xiàn)代農(nóng)藥的研發(fā)已離不開生物信息技術的參與,隨著生物信息學技術的進一步完善和發(fā)展,將會大大降低藥物研發(fā)的成本,提高研發(fā)的質(zhì)量和效率。

4.生物學信息學在作物遺傳育種研究領域中的應用

隨著主要農(nóng)作物遺傳圖譜精確度的提高,以及特定性狀相關分子基礎的進一步闡明,人們可以利用生物信息學的方法,先從模式生物

中尋找可能的相關基因,然后在作物中找到相應的基因及其位點。農(nóng)作物的遺傳學和分子生物學的研究積累了大量的基因序列、分子標記、圖譜和功能方面的數(shù)據(jù),可通過建立生物信息學數(shù)據(jù)庫來整合這些數(shù)據(jù),從而比較和分析來自不同基因組的基因序列、功能和遺傳圖譜位置[15]。在此基礎上,育種學家就可以應用計算機模型來提出預測假設,從多種復雜的等位基因組合中建立自己所需要的表型,然后從大量遺傳標記中篩選到理想的組合,從而培育出新的優(yōu)良農(nóng)作物品種。

5.生物信息學在生態(tài)環(huán)境平衡研究領域中的應用

在生態(tài)系統(tǒng)中,基因流從根本上影響能量流和物質(zhì)流的循環(huán)和運轉(zhuǎn),是生態(tài)平衡穩(wěn)定的根本因素。生物信息學在環(huán)境領域主要應用在控制環(huán)境污染方面,主要通過數(shù)學與計算機的運用構(gòu)建遺傳工程特效菌株,以降解目標基因及其目標污染物為切入點,通過降解污染物的分子遺傳物質(zhì)核酸 dna,以及生物大分子蛋白質(zhì)酶,達到催化目標污染物的降解,從而維護空氣[16]、水源、土地等生態(tài)環(huán)境的安全。

美國農(nóng)業(yè)研究中心(ars) 的農(nóng)藥特性信息數(shù)據(jù)庫(ppd) 提供 334 種正在廣泛使用的殺蟲劑信息,涉及它們在環(huán)境中轉(zhuǎn)運和降解途徑的16種最重要的物化特性。日本豐橋技術大學(toyohashi university of technology) 多環(huán)芳烴危險性有機污染物的物化特性、色譜、紫外光譜的譜線圖。美國環(huán)保局綜合風險信息系統(tǒng)數(shù)據(jù)庫(iris) 涉及 600種化學污染物,列出了污染物的毒性與風險評價參數(shù),以及分子遺傳毒性參數(shù)[17]。除此之外,生物信息學在生物防治[18]中也起到了重要的作用。網(wǎng)絡的普及,情報、信息等學科的資源共享,勢必會創(chuàng)造出一個環(huán)境微生物技術信息的高速發(fā)展趨勢。

6.生物信息學在食品安全研究領域中的應用

食品在加工制作和存儲過程中各種細菌數(shù)量發(fā)生變化,傳統(tǒng)檢測方法是進行生化鑒定,但所需時間較長,不能滿足檢驗檢疫部門的要求,運用生物信息學方法獲得各種致病菌的核酸序列,并對這些序列進行比對,篩選出用于檢測的引物和探針,進而運用pcr法[19]、rt-pcr法、熒光rt-pcr法、多重pcr[20]和多重熒光定量pcr等技術,可快速準確地檢測出細菌及病毒。此外,對電阻抗、放射測量、elisa法、生物傳感器、基因芯片等[21-25]技術也是未來食品病毒檢測的發(fā)展方向。

轉(zhuǎn)基因食品檢測是通過設計特異性的引物對食品樣品的dna提取物進行擴增,從而判斷樣品中是否含有外源性基因片段[26]。通過對轉(zhuǎn)基因農(nóng)產(chǎn)品數(shù)據(jù)庫信息的及時更新,可準確了解各國新出現(xiàn)和新批準的轉(zhuǎn)基因農(nóng)產(chǎn)品,便于查找其插入的外源基因片段,以便及時對檢驗方法進行修改。目前由于某些通過食品傳播的病毒具有變異特性,以及檢測方法的不完善等因素影響,生物信息學在食品領域的應用還比較有限,但隨著食品安全檢測數(shù)據(jù)庫的不斷完善,相信相關的生物信息學技術將在食品領域發(fā)揮越來越重要的作用。

  生物信息學廣泛用于農(nóng)業(yè)科學研究的各個領域,但是僅有信息資源是不夠的,選出符合自己需求的生物信息就需要情報部門,以及信息中介服務機構(gòu)提供相關服務,通過出版物、信息共享平臺、數(shù)字圖書館、電子論壇等信息媒介的幫助,科研工作者可快速有效地找到符合需要的信息。目前我國生物信息學發(fā)展還很不均衡,與國際前沿有一定差距,這需要從事信息和科研的工作者們不斷交流,使得生物信息學能夠更好地為我國農(nóng)業(yè)持續(xù)健康發(fā)展發(fā)揮作用。

參考文獻:

[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.

[2]鄭國清,張瑞玲.生物信息學的形成與發(fā)展[j].河南農(nóng)業(yè)科學,2002,(11):4-7.

[3]駱建新,鄭崛村,馬用信等.人類基因組計劃與后基因組時代.中國生物工程雜志,2003,23,(11):87-94.

[4]曹學軍.基因研究的又一壯舉——美國國家植物基因組計劃[j].國外科技動態(tài),2001,1:24-25.

[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.

[6]盧新雄.植物種質(zhì)資源庫的設計與建設要求[j].植物學通報,2006,23,(1):119-125.

[7]guy d,noel

e,mike a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.

[8]鄭衍,王非.藥物生物信息學,化學化工出版社,2004.1:214-215.

[9]俞慶森,邱建衛(wèi),胡艾希.藥物設計.化學化工出版社,2005.1:160-164.

[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.

[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.

[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.

[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.

[14]楊華錚,劉華銀,鄒小毛等.計算機輔助設計與合成除草劑的研究[j].計算機與應用化學,1999,16,(5):400.

[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.

[16]王春華,謝小保,曾海燕等.深圳市空氣微生物污染狀況監(jiān)測分析[j].微生物學雜志,2008,28,(4):93-97.

[17]程樹培,嚴峻,郝春博等.環(huán)境生物技術信息學進展[j].環(huán)境污染治理技術與設備,2002,3,(11):92-94.

[18]史應武,婁愷,李春.植物內(nèi)生菌在生物防治中的應用[j].微生物學雜志,2009,29,(6):61-64.

[19]趙玉玲,張?zhí)焐?,張巧艷.pcr 法快速檢測肉食品污染沙門菌的實驗研究[j].微生物學雜志,2010,30,(3):103-105.

[20]徐義剛,崔麗春,李蘇龍等.多重pcr方法快速檢測4種主要致腹瀉性大腸埃希菌[j].微生物學雜志,2010,30,(3) :25-29.

[21]索標,汪月霞,艾志錄.食源性致病菌多重分子生物學檢測技術研究進展[j].微生物學雜志,2010,30,(6):71-75

[22]朱曉娥,袁耿彪.基因芯片技術在基因突變診斷中的應用及其前景[j].重慶醫(yī)學,2010,(22):3128-3131.

[23]陳彥闖,辛明秀.用于分析微生物種類組成的微生物生態(tài)學研究方法[j].微生物學雜志,2009,29,(4):79-83.

[24]王大勇,方振東,謝朝新等.食源性致病菌快速檢測技術研究進展[j].微生物學雜志,2009,29,(5):67-72.

[25]蘇晨曦,潘迎捷,趙勇等.疏水網(wǎng)格濾膜技術檢測食源性致病菌的研究進展[j].微生物學雜志,2010,30,(6):76-81.

第6篇:生物信息學概念范文

[關鍵詞]生物信息學;案例教學;生物類專業(yè)

[中圖分類號]G64 [文獻標識碼]A [文章編號]1005-6432(2014)48-0179-03

生物信息學是一門交叉科學,它包含了生物信息的獲取、處理、存儲、、分析和解釋等在內(nèi)的所有方面,綜合運用生物學、數(shù)學、計算機科學等方法,闡述和理解數(shù)據(jù)所包含的生物學意義。作為21世紀生命科學領域發(fā)展最為迅速的學科之一,生物信息學已成為介于生物學和計算機科學前沿的重要學科。實驗室的每一項技術,從簡單的克隆、PCR到基因數(shù)據(jù)分析都需要在計算機上進行處理。因此對生物學專業(yè)的學生而言,具有一定程度的理解和應用生物信息學技術的能力是十分必要的。而課程是為培養(yǎng)目標服務的。這就要求教師在有限的授課時間內(nèi),使學生不僅掌握基本的理論知識,緊跟科研的最新進展,而且在今后的科研工作中能學以致用。

1 理論與實踐相結(jié)合的教學手段

根據(jù)當今生物信息學的發(fā)展方向,教師結(jié)合理論教學內(nèi)容增加綜合性、開放性實驗,使學生循序漸進地理解和掌握生物信息學的原理和方法,進而運用合適的生物信息學工具解決問題。本文以兩個案例解析這一教學過程。一是信息的簡單檢索。在獲取生物信息的同時,理解數(shù)據(jù)庫概念、動態(tài)規(guī)劃和bootstrap等算法;二是高通量測序的數(shù)據(jù)分析。在實現(xiàn)大規(guī)模數(shù)據(jù)處理和分析的同時,掌握統(tǒng)計分析基礎知識。

1.1 生物信息的簡單檢索

近一二十年,生物學數(shù)據(jù),尤其是序列數(shù)據(jù),以指數(shù)級的方式增長。以GenBank的核酸數(shù)據(jù)庫為例,每12~20個月數(shù)據(jù)就翻一番,略高于Moore定律提供的參考數(shù)值。如何從這些海量數(shù)據(jù)中獲取想要的信息,已成為生物學專業(yè)學生必須掌握的技能之一。而如何正確獲取和應用信息,則需要了解數(shù)據(jù)是如何被存儲、解析,以及背后隱藏的算法。因此圍繞正確挖掘數(shù)據(jù)信息這一主題,設計以下案例,通過4步展開教和學。

1.1.1 講解

基于大數(shù)據(jù)教師引申出數(shù)據(jù)庫存儲信息的概念。而后分類介紹常用的基因組數(shù)據(jù)庫、核酸序列數(shù)據(jù)庫、蛋白質(zhì)序列數(shù)據(jù)庫、蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫以及各種常用復合數(shù)據(jù)庫。

1.1.2 演示

了解上述常用的數(shù)據(jù)庫之后,教師實例演示數(shù)據(jù)庫檢索。通過逐層提出問題,誘導學生思考如何利用上述不同的數(shù)據(jù)庫資源,一步一步挖掘所需的信息。例如,被測序的片段是哪個基因?該基因編碼的蛋白質(zhì)序列是什么?是否有保守的功能結(jié)構(gòu)域?在亞細胞的什么位置發(fā)揮什么功能?可能的三級結(jié)構(gòu)?和哪些蛋白或RNA存在可能的相互作用?它在進化中又是如何演變的?

1.1.3 實踐

讓學生上機操作上述實例,體驗各個數(shù)據(jù)庫的側(cè)重點,并理解不同軟件不同參數(shù)的意義或差別。比如GenBank和Swissprot的側(cè)重點,PAM-n和BLOSUM-n的選取。

1.1.4 成文

引導學生形成可重復計算的科學文檔。對每一個案例,教師展示常規(guī)性的文件組織形式:/data,/analysis,/scripts,/reference等。寫說明文檔的時候,要求學生記錄每一個分析步驟的所有細節(jié):數(shù)據(jù)庫的網(wǎng)址、軟件的名稱、版本、輸入的文件、精確的運行參數(shù)、結(jié)果的提取等。

通過這樣的案例教學模式,一是較好地將知識點融合串聯(lián)到教師講授和學生上機操作中。二是使學生不僅熟悉各種常見的數(shù)據(jù)庫,而且理解數(shù)據(jù)庫中各個軟件及其參數(shù)的意義,遇到實際問題也不再束手無策。而教師也可以充分參與到學生的學習中,對學生上機操作過程中出現(xiàn)的一些主要理論與技能問題了如指掌。通過教―學―練―教―練,達到學以致用的教學目的。三是培養(yǎng)學生創(chuàng)建較好的文檔及其組織形式,形成科學研究的可重復性(replication)和可復現(xiàn)性(reproducibility)。不僅有利于追溯前因,而且對代碼的復用,以及對結(jié)果應用于新項目都非常必要。

1.2 高通量測序數(shù)據(jù)的分析

隨著高通量測序技術的興起,大量物種的全基因組數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)和其他類型數(shù)據(jù)被測定完成或正在進行中,每天都有成千上萬的數(shù)據(jù)被源源不斷地輸入相應的生物信息庫中。這些大規(guī)模數(shù)據(jù)的不斷產(chǎn)出,使得生物學專業(yè)學生掌握高通量數(shù)據(jù)分析技術已成為一種趨勢。因此,教師有必要將這部分內(nèi)容由理論講授過渡到上機操作。

1.2.1 介紹

教師以DNA測序技術發(fā)展為主線,理論介紹De Novo測序、ChIP-seq測序、RNA-seq測序、Methyl-seq測序等。并通過拍攝的錄像,向?qū)W生直觀地展示不同的測序儀及其特點。

1.2.2 演示

教師對整個分析過程進行詳細的闡述并實時上機演示(下圖)。以轉(zhuǎn)錄組RNA-seq為例,包括測序質(zhì)量的評估(堿基組成和堿基質(zhì)量分析)、clean reads的篩選、利用TopHat/Bowtie將篩選出來的reads比對到參考轉(zhuǎn)錄本、統(tǒng)計reads在參考基因上的分布情況及覆蓋度,判斷比對結(jié)果是否通過第二次質(zhì)控、通過cuffmerge將重復測序得到的reads形成一致性轉(zhuǎn)錄本、基因結(jié)構(gòu)優(yōu)化、基因覆蓋度統(tǒng)計、使用cuffdiff篩選差異表達基因和鑒別可變剪切體、對結(jié)果基因進行聚類分析、GO和pathway富集性分析。

1.2.3 實踐

讓學生分組討論并上機實現(xiàn)上述數(shù)據(jù)分析流程。掌握基本的Linux命令、統(tǒng)計計算和可視化分析。

1.2.4 成文

引導學生形成規(guī)范化文檔和腳本,以便回溯和可重復性使用。

高通量數(shù)據(jù)分析不僅涉及的知識點多,而且需要在Linux下進行簡單的操作和軟件的使用。對生物學專業(yè)的學生來說,容易造成心理上的抗拒。教師可以采用“分而食之”的策略:將教學內(nèi)容分成相對獨立完整又有一定聯(lián)系的幾個部分(下圖)。對于每部分內(nèi)容,教師利用已講解的相關知識給學生實時演示,并給出教師自己的理解和結(jié)果。然后把學生分組,讓他們根據(jù)自己的理解,帶著興趣和疑問上機實踐。并在上機操作過程中,鼓勵學生之間、學生與教師之間及時討論交流。最后讓學生將所有內(nèi)容串聯(lián)起來,介紹本組的實驗內(nèi)容及解決辦法。通過這種方式能較明顯地消除心理顧慮,有助于學生獨立思考,獨立解決問題。

“RNA-seq數(shù)據(jù)分析”案例教學流程圖

2 以能力測試為中心的考核方式

對于生物學專業(yè)的學生而言,生物信息學是一門實踐性很強的學科。因此,教師采用以“能力測試”為中心,知識與技能考核并重的考核方式。以上述兩個案例為例,在期末考試中,教師將NCBI GEO中“(RNA-seq[Title])AND “Mus musculus”[porgn:__txid10090]”722個實驗數(shù)據(jù),隨機分配給每個學生。要求每個學生對分配到的RNA-seq數(shù)據(jù)進行差異表達分析,聚類分析和富集性分析。并選擇合適的基因,分析其保守的功能結(jié)構(gòu)域、亞細胞定位以及可能的蛋白質(zhì)結(jié)構(gòu)和功能、可能結(jié)合的轉(zhuǎn)錄因子、相互作用的蛋白質(zhì)網(wǎng)絡和信號通路、構(gòu)建相應的系統(tǒng)進化樹。

學生對上述每一個小題從“知識點”、“參考資料”、“使用軟件或工具”、“參數(shù)”、“腳本”、“結(jié)果”分別答題,不僅非常有效地明確所學的內(nèi)容,而且很好地杜絕了作弊行為。

3 教學效果

為了解案例教學的效果,本課程案例教改活動向2011級生物科學和免疫學專業(yè)學生QQ群發(fā)放電子問卷,共收回82份答卷,統(tǒng)計結(jié)果如下表所示。從表中可以看出,案例教學模式使學生有較強的參與感,能較好地提高學生的學習興趣,學生對理論問題的認識更為深刻。

4 結(jié) 論

案例教學基于具體的事例,將一系列的知識點有機地串聯(lián)起來,并通過實例操作達到學以致用的目的。從學生反饋意見可以看出,這種理論與實踐結(jié)合的教學模式,很好地提高了學生的學習興趣??紤]到有限的授課時間和不同學生的學習背景,作為教師需要設計合適的案例,從而達到較好的教學效果。一般可以遵循以下原則。

4.1 具有代表性

所選的案例既要經(jīng)典又要緊跟科學前沿。比如第一個案例所蘊含的數(shù)據(jù)庫檢索、序列比對和系統(tǒng)進化樹的構(gòu)建,在生物信息學中,屬于較經(jīng)典且核心的知識點。而第二個案例選擇的對象則與當前的科研熱點緊密聯(lián)系。

4.2 具有偏向性

生物信息學本身是個交叉學科,涉及的知識點相對較多。面對生物類專業(yè)背景的學生,我們側(cè)重生物信息學方法或者工具(軟件)的應用,而不是強調(diào)算法。比如第一個案例中系統(tǒng)進化樹的構(gòu)建,我們只是以5條8bp長的序列為例講解最小進化法和鄰接法、最大簡約法、最大似然法以及貝葉斯推斷,重點在于強調(diào)不同的數(shù)據(jù)適合采用上述哪些方法以及如何用Mega等軟件實現(xiàn)系統(tǒng)進化樹的構(gòu)建。

4.3 先后案例有層次性

比如第一個案例中,學生掌握了Windows下的序列比對。對于第二個案例中Linux下的Bowtie就容易理解并操作。

4.4 具有拓展性

比如第一個案例中,在Windows的DOS下進行批量序列比對時,不同的參數(shù)設置,輸出不同的數(shù)據(jù)格式。第二個案例中,Bowtie最多允許3個錯配,如果允許更多的錯配數(shù),則可以采用SOAPaligner/ SOAP2實現(xiàn)。學生可以根據(jù)自己的興趣和能力,選擇拓展性內(nèi)容進行繼續(xù)學習。

4.5 良好的成文習慣

引導學生養(yǎng)成良好的文檔組織和書寫習慣。每一個案例,都要求學生形成可重復性和可復現(xiàn)性的文檔,對于整理分析思路、核實結(jié)果、重復使用代碼都起到事半功倍的效果。

生物信息學是現(xiàn)代生物科學研究的重要工具和載體。如何有效正確地應用生物信息學,是每一個生物實驗者需要具備的能力。教師應緊跟學科發(fā)展的速度,圍繞學以致用的原則,將案例教學科學地、和諧地應用到教學實踐中,不僅使學生掌握一定的理論知識,從而正確地應用軟件工具,而且逐漸培養(yǎng)學生自我分析和解決問題的能力。

參考文獻:

[1]LuscombeNM,Greenbaum D,Gerstein M.Whatis bioinformatics? A proposed definition and overview of the field[J].Methods Inf Med,2001,40(4).

[2]ENCODE Project Consortium.An integrated encyclopedia of DNA elements in the human genome[J].Nature,2012,489(7414).

[3]1000 Genomes Project Consortium,Abecasis GR,Auton A,Brooks LD,DePristo MA,Durbin RM,Handsaker RE,Kang HM,Marth GT,McVean GA.An integrated map of genetic variation from 1,092 human genomes[J].Nature,2012,491(7422).

[4]Sandve GK,Nekrutenko A,Taylor J,Hovig E.Ten simple rules for reproducible computational research[J].PLoS Comput Biol,2013,9(10).

[5]McCormick M,Liu X,Jomier J,Marion C,Ibanez L.ITK:enabling reproducible research and open science[J].Front Neuroinform,2014(8).

[6]李偉蘭.論大學生學習心理障礙的成因及基本對策[J].湖北函授大學學報,2012,5(25).

第7篇:生物信息學概念范文

關鍵詞:藥物篩選;分子印跡技術;高通量篩選技術;生物芯片技術;生物信息學技術

藥物篩選是應用適當?shù)姆椒ê图夹g根據(jù)特定的目的對藥物進行優(yōu)選的過程。藥物的種類很多,從大量的藥物中找出對特定疾病有針對性治療作用的藥物是個復雜的過程。傳統(tǒng)的藥物篩選一般是采用生物學方法,也就是將藥物與相應的病原作用,能夠有效抑制病原生長或?qū)σ延胁≡袣缱饔玫募礊橛行幬?。然而對于由病毒或細菌引起的具有強傳染性的疾病此種方法是一項既繁瑣,危險性大又對實驗條件要求極高的工作。因此,應建立非生物學方法來替代傳統(tǒng)生物學方法。所謂的非生物學藥物篩選方法即在不接觸傳染性病原的情況下進行藥物篩選。篩選的方法可以是間接的篩選藥物,如分子印跡法、生物信息學法;也可以是獲得病原的相應結(jié)合靶點來選取有效藥物,如高通量篩選技術和生物芯片技術。本文將對非生物學藥物篩選方法進行簡要綜述[1]。

1分子印跡技術

分子印跡技術也叫分子烙印技術或分子模板技術(molecularimprintingtechnique,MIT),是一種模擬抗原與抗體相互作用的人工生物模板技術。分子印跡聚合物(molecularlyimprintedpolymers,MIPs)也就是由分子印跡技術制備出來的,具有高效、穩(wěn)定、使用壽命長等優(yōu)點。在對映體和異構(gòu)體的分離[2,3]、固相萃取[4,5]、緩控釋給藥系統(tǒng)[6]、臨床藥物分析、膜分離技術[7]、模擬酶催化[8]、化學仿生傳感器[9]等領域中MIPs都展現(xiàn)了良好的應用前景。MIPs的制備過程為:①在溶劑(致孔劑)中將模板分子和功能單體按照一定比例混合后一定條件下進行反應,通過共價鍵或非共價鍵作用形成可逆的模板分子-功能單體復合物;②加入交聯(lián)劑、引發(fā)劑,使模板-功能單體復合物通過聚合反應在模板分子周圍形成高交聯(lián)的剛性聚合物;③將模板分子(印跡分子)從聚合物中洗脫解離出來,這樣在聚合物的骨架上便留下了一個對模板分子有“預定”選擇性的識別空位??瘴恢泻芯_排列的與模板分子官能團相互補的由功能單體提供的功能基團[10]。分子印跡聚合物中的空位和模板分子形狀、大小完全一樣,從而實現(xiàn)對模板分子的特異性識別。印跡聚合過程如圖1所示[11]。MIT具有分子識別性強、固定相制備簡便快速、操作簡單、性質(zhì)比較穩(wěn)定(耐酸堿、耐高溫、高壓等)、溶劑消耗量小、模板和MIPs都可以回收再利用等優(yōu)點。

應用分子印跡技術,根據(jù)已篩選出的對相應病原有抑制作用的化合物作為模板建立生物法替代篩選模型。一方面可以避免與病原的直接接觸,增強安全性;二是可以在普通實驗室進行實驗,實驗條件要求低;三是有針對性的選擇有效藥物成分,縮短了篩選時間和實驗強度;四是精確有效篩選。如中草藥含的化合物結(jié)構(gòu)類型多樣,含量懸殊且許多成分是未知的,因此從中分離純化有效成分是一項費時費力的工作,而且容易丟失微量的有效成分。為了盡快從中草藥中尋找出高效的實體藥物及各配方的有效成分,以及將中藥推向國際市場并從中發(fā)現(xiàn)療效顯著的符合歐美市場要求的新藥,就可以應用分子印跡技術來達到這個目的。謝建春等[12]以駱駝蓬種籽中抗腫瘤活性化合物哈爾滿作為模板,用非共價鍵法制備了對哈爾滿結(jié)構(gòu)類似物哈爾明及哈馬靈具有強親和性的分子印跡聚合物。分離鑒定了駱駝蓬種籽甲醇粗提物中所含的哈爾明及哈馬靈兩種抗腫瘤活性成分。此實驗結(jié)果說明了通過分子印跡技術能夠有效地對中草藥活性成分進行分離。實驗還說明了通過分子印跡親和色譜與質(zhì)譜聯(lián)用可以分離鑒定復雜成分中有效成分。這對于篩選已知藥物的結(jié)構(gòu)類似物無疑是種簡單快速安全的方法。

2高通量藥物篩選技術

高通量藥物篩選(highthroughputscreening,HTS)是20世紀80年代后期發(fā)展起來的一項快速尋找新藥的技術。篩選的對象是藥物作用靶點,根據(jù)待選樣品與靶點是否相互作用來判斷待選化合物的生物活性。高通量藥物篩選技術涉及自動化控制技術、細胞生物學技術、藥理學實驗技術、分子生物學技術和管理技術以及計算機計算等。隨著各學科的發(fā)展及相應技術的成熟[13],高通量藥物篩選技術憑借其自動化操作系統(tǒng)和微量靈敏的檢測系統(tǒng),使其篩選速度快、規(guī)模大、用量小實現(xiàn)一藥多篩。

高通量篩選的體外模型通常有分子水平模型和細胞水平的模型,分子水平模型主要分為受體模型、酶篩選模型和離子通道篩選模型。細胞水平藥物篩選模型是以細胞功能為基礎的篩選模型。各種模型篩選的原理有3個方面,一是待選化合物與靶點的作用。多數(shù)情況下藥物與靶點相結(jié)合從而產(chǎn)生治療作用。其作用原理如同受體-配體相互作用。可以與相應受體結(jié)合的化合物就有可能是有活性的成分;二是待選化合物對酶活性的影響。生物體內(nèi)的許多生理生化反應都必須有酶的參與,加入待測化合物的同時測定酶的一些指標,以指標的變化為依據(jù)來評價化合物的作用。此種模型相對易于檢測,被普遍使用;三是待測化合物對細胞的作用。通過化合物的篩選,了解整體細胞對化合物作用的反應。靶向細胞因子、生長因子、離子通道和G-蛋白耦聯(lián)受體(GPCR)在細胞水平上的功能性檢測中都取得了成功的進展[13]。(i)復合物化(ii)聚合(iii)去模板分子a.模板分子b.聚合前復合物c.聚合后復合物d.模板分子去除后的聚合物圖1分子印跡聚合過程示意圖據(jù)統(tǒng)計高通量藥物篩選技術每天可以對數(shù)以萬計的樣品化合物進行篩選,應用得最多的是組合化學庫。我國中藥資源豐富,許多資源尚未開發(fā)。有部分中藥及組方治療作用明確,但大部分作用機理尚不清楚。從而限制了中藥的發(fā)展及國際化的要求。由于中藥有效成分具有多靶點的作用特點,故天然產(chǎn)物庫的建立將為高通量藥物篩選提供更多更全面的化合物[14,15],同時中藥有效成分的作用機理也會明確。羅弟祥等[16]用PTP1B(蛋白酪氨酸磷酸酶1B)抑制劑高通量篩選模型對17940個植物提取物和其組分進行了篩選,陽性率為2.85%[17]。另外針對腫瘤、2型糖尿病[18]、神經(jīng)系統(tǒng)疾病、免疫系統(tǒng)疾病和感染性疾病等相關靶點明確的疾病,已經(jīng)逐步建立和完善了以高通量分子篩選模型為初篩的篩選體系。隨著生物化學、分子生物學、細胞生物學、蛋白質(zhì)組學及基因工程等學科的發(fā)展,疾病的發(fā)病機理越來越明確。特別是對于一些病毒和病菌,它們的致病靶標也越發(fā)的清晰。只要針對相應的靶標進行篩選,就能夠很快找到相應的有效藥物,這樣就可以減少操作的危險性,避免與相應病原直接接觸,同時也加快了藥物的篩選速度及篩選的精確性[19]。曹鴻鵬等[20]以神經(jīng)氨酸酶(NA)為抗流感藥物的作用靶點建立可用于高通量藥物篩選的模型來篩選NA抑制劑,初篩發(fā)現(xiàn)12個化合物對流感病毒神經(jīng)氨酸酶有可重復的抑制活性。高通量藥物篩選過程是從藥物作用靶點水平篩選藥物即只是停留在分子細胞水平,而藥物的作用多數(shù)是要全面分析。由于藥物經(jīng)過體內(nèi)循環(huán)代謝到達靶點時的濃度及代謝物藥效是有變化的,所以必須在篩選之后進行相應的組織器官和整體動物水平的藥物篩選來確定藥效。

3生物芯片技術

生物芯片(biochip)是指采用光導原位合成或微量點樣等方法,將大量生物大分子如核酸片段、多肽分子甚至組織切片、細胞等生物樣品以陣列式有序地固化于支持物(玻片、硅片、聚丙烯酰胺凝膠、尼龍膜等載體)的表面,組成密集二維分子排列,然后與已標記的待測生物樣品中靶分子雜交,通過特定的儀器對雜交信號的強度進行檢測分析來判斷樣品中靶分子的種類和數(shù)量[21],從而實現(xiàn)對細胞、蛋白質(zhì)、DNA以及其它生物組分的檢測,把生化分析系統(tǒng)中的樣品制備、生化反應和結(jié)果檢測3個部分有機的結(jié)合起來,具有快速、高通量、高信息量、平行化、集約化、微型化、自動化、成本低、污染少、用途廣等特點[22]。

生物芯片包括基因芯片、蛋白質(zhì)芯片、芯片實驗室(微全分析系統(tǒng))、細胞芯片以及組織芯片等。另外根據(jù)原理還有組件型微陣列芯片、通道型微陣列芯片、生物傳感芯片等新型生物芯片。藥物通過不同的靶點作用于組織細胞,直接或間接地影響細胞內(nèi)基因的表達及蛋白質(zhì)的生成。通過對用藥前后兩組樣品進行表達譜生物芯片檢測,就可以反映出該藥物作用后相應組織或細胞中基因表達譜及蛋白質(zhì)等的變化,從而揭示藥物的作用。生物芯片技術可以尋找藥物靶標、進行毒理學研究、研究藥物處理細胞后基因的表達情況、藥物分析、中藥研究、指導臨床個體化用藥、抗藥性研究、建立生物技術平臺等[23]。

托婭等[24]研究基因芯片篩選抗腫瘤血管生成中草藥的相關基因,實驗結(jié)果顯示利用基因芯片技術可從基因水平解釋中藥的作用機制,為新藥的開發(fā)提供理論依據(jù)。LiX等[25]采用微流體芯片技術檢測中藥成分對白血病細胞的早期細胞毒性,結(jié)果表明用此法不但能夠縮短藥物篩選的周期、降低實驗成本而且還能解決傳統(tǒng)技術中遇到的顏色和化學干擾問題。生物芯片技術使高通量藥物篩選的單靶點單模型模式轉(zhuǎn)變?yōu)橥瑫r對多靶點進行篩選的新模式,逐漸形成了超高通量藥物篩選的概念。由于生物芯片體積小,包含的藥物作用靶點多,從理論上講,生物芯片技術和高通量藥物篩選技術相結(jié)合,不僅可同時對大量化合物進行生物活性篩選,而且可同時對大量藥物作用靶點篩選。隨著分子生物學的發(fā)展而建立起來的分子水平的藥物篩選模型,可以從更深入的層次評價藥物的作用,從而可以為許多疑難病癥提供新的治療途徑和方法。應用生物芯片大規(guī)模的篩選研究可以減少大量的動物試驗,縮短藥物篩選所用時間,增強實驗過程中的安全性,從而帶動藥物的研究和開發(fā)。

4生物信息學技術

第8篇:生物信息學概念范文

【關鍵詞】亞細胞定位;特征信息提?。活A測算法

亞細胞定位是指某種蛋白或某種基因表達產(chǎn)物在細胞內(nèi)的具體存在部位,即根據(jù)所給出的蛋白質(zhì)序列來預測其所在的亞細胞位置。蛋白質(zhì)是基因功能的執(zhí)行者,機體中的每一個細胞和所有重要組成部分都有它的參與,正是由于它是與生命及與各種形式的生命活動緊密聯(lián)系在一起的物質(zhì),越來越多的生物學、生物信息學研究者開始對蛋白質(zhì)的功能預測及分析進行了研究。然而,蛋白質(zhì)只有經(jīng)分選信號引導后運輸?shù)教囟ǖ募毎髦?,才能參與細胞的各種生命活動,執(zhí)行它的功能,如果其運送位置發(fā)生偏差,將會影響細胞功能甚至整個生物體。因此,蛋白質(zhì)在細胞中的正確定位是細胞系統(tǒng)高度有序運轉(zhuǎn)的前提保障。研究細胞中蛋白質(zhì)定位的機制和規(guī)律,預測蛋白質(zhì)的亞細胞定位,對于了解蛋白質(zhì)結(jié)構(gòu)、性質(zhì)和功能,了解蛋白質(zhì)之間的相互作用,研究疾病機理和發(fā)展新藥物以及探索生命的規(guī)律和奧秘具有重要意義。

隨著核酸和蛋白質(zhì)序列等生物數(shù)據(jù)的高速膨脹,單純以傳統(tǒng)實驗方法來確定蛋白質(zhì)亞細胞定位具有成本高、實驗時間長,預測精度不理想,會耗費大量的人力和物力等缺點,已經(jīng)無法滿足生命科學研究的需要。因此,需要尋找一種快速、有效、準確的計算方法來預測蛋白質(zhì)亞細胞定位。近年來,生物信息學在這方面開展了廣泛的研究并且取得一系列很有意義的成果,數(shù)據(jù)庫的構(gòu)建和亞細胞定位分析及預測加速了蛋白質(zhì)結(jié)構(gòu)和功能的研究。一方面,生物信息學研究可以對大規(guī)模的實驗數(shù)據(jù)進行分析和提取生物學信息,同時可以根據(jù)現(xiàn)有數(shù)據(jù)對一些目前還未知的蛋白質(zhì)做出預測;另一方面,不斷增長的亞細胞定位數(shù)據(jù)也可以用來驗證并改進預測結(jié)果。目前,利用生物信息學方法進行蛋白質(zhì)亞細胞定位預測已經(jīng)成為了一個研究熱點。

從20世紀90年代初至今,蛋白質(zhì)亞細胞定位預測一直是生物信息學研究的熱點問題之一。通過分析國內(nèi)外研究者的研究方法,不難發(fā)現(xiàn)這些方法的主要不同在于兩個方面: 第一,蛋白質(zhì)特征信息的提取,主要是指將蛋白質(zhì)相關特征信息提取出之后轉(zhuǎn)化成高維的特征向量,作為預測的輸入。蛋白質(zhì)序列特征信息主要包括氨基酸順序相關性、氨基酸在蛋白質(zhì)中出現(xiàn)的頻率、氨基酸物理化學性質(zhì)等。第二,預測算法的設計,根據(jù)提取的特征向量集,利用有效的算法預測蛋白質(zhì)的亞細胞定位。算法影響亞細胞預測精度的重要因素,現(xiàn)有預測算法中,統(tǒng)計學和機器學習方法使用的最為廣泛。

利用計算方法來預測蛋白質(zhì)亞細胞定位屬于統(tǒng)計模式識別中的模式多分類問題。問題的研究一般包括以下四個步驟:(1)具有客觀代表性的蛋白質(zhì)數(shù)據(jù)集的構(gòu)建; (2)蛋白質(zhì)序列的特征提取,即蛋白質(zhì)序列編碼,從蛋白質(zhì)中提取特征參數(shù),實現(xiàn)字母序列到數(shù)值特征的轉(zhuǎn)換;(3)預測算法的選取,即如何根據(jù)提取的特征參數(shù),設計有效的分類或識別模型類;(4)對預測結(jié)果進行評估,即預測模型的測試與檢驗以及結(jié)果性能的評估。

1 數(shù)據(jù)集的構(gòu)建

研究蛋白質(zhì)亞細胞定位的數(shù)據(jù)集基本來自SWISS-PROT數(shù)據(jù)庫。該數(shù)據(jù)庫建于1986年,是目前世界上存儲蛋白質(zhì)序列最主要的一級數(shù)據(jù)庫之一。利用這個數(shù)據(jù)庫研究蛋白質(zhì)的亞細胞定位時,需要對其中的數(shù)據(jù)進行篩選。通常的篩選標準有:(1)針對研究對象,挑選特定物種的相關蛋白質(zhì)序列;(2)在構(gòu)建數(shù)據(jù)集時,需要知道每個蛋白質(zhì)序列所在的亞細胞位置,所以只有包含明確的亞細胞定位信息的序列才被選入數(shù)據(jù)集中;(3)序列長度不能太短;(4)數(shù)據(jù)冗余度,要求同源性低;(5)排除樣本量太少的亞細胞類別。

除了利用SWISS-PROT數(shù)據(jù)庫外,還有LOCATE、TargetP家族數(shù)據(jù)集等。近年來,隨著研究的不斷深入,蛋白質(zhì)序列數(shù)據(jù)集越來越復雜,目前最復雜的數(shù)據(jù)集是酵母蛋白質(zhì)序列數(shù)據(jù)集,包含22種亞細胞蛋白質(zhì)。

2 蛋白質(zhì)特征信息的提取

蛋白質(zhì)序列特征提取的目的是,從蛋白質(zhì)序列中提取特征信息,并用適當?shù)臄?shù)學方法來描述或表示這些信息,使之能正確反映序列與結(jié)構(gòu)或功能之間的關系,這于蛋白質(zhì)亞細胞定位是至關重要的,也是研究蛋白質(zhì)功能結(jié)構(gòu)的關鍵。根據(jù)提取特征信息的不同,可以歸納為3類。

2.1 基于氨基酸的組成和性質(zhì)

氨基酸組成是一種最基本的序列特征,也是亞細胞定位預測中使用得最為普遍的一種蛋白質(zhì)特征信息。蛋白質(zhì)一般有20 種氨基酸組成,氨基酸組成將每種氨基酸在蛋白質(zhì)序列中出現(xiàn)的頻率抽取出來作為一個20維的向量。1994年,Nakashima和 Nishikawa最早通過利用氨基酸組成進行了蛋白質(zhì)亞細胞定位預測,對細胞內(nèi)和細胞外蛋白質(zhì)定位分別取得了88%和 84%的預測準確率。

2.2 基于蛋白質(zhì)序列的N端分選信號的方法

一般認為蛋白質(zhì)在合成的過程中,其N端包含一些特殊的分選信號,這些信號能夠指導新合成的蛋白質(zhì)分選到特定的亞細胞中,包括信號肽、線粒體轉(zhuǎn)移肽、葉綠體運輸肽、核定位信號、類囊體腔轉(zhuǎn)移肽和過氧化物酶體定位信號等。這種信息的有效性取決于蛋白質(zhì)序列完整性,一旦蛋白質(zhì)序列的N端信號不完整或者丟失,預測結(jié)果就可能失效。

2.3 基于功能域和基因注釋的方法

蛋白質(zhì)序列在長期的進化過程中,某些特定位點上的氨基酸殘基具有高度的保守性,這些位點稱為功能域。2002年功能域組分的概念首次被用于蛋白質(zhì)亞細胞定位,這種方法顯著提高了亞細胞定位的質(zhì)量。2006年,引入GO注釋來預測人類蛋白質(zhì)的亞細胞位置。但是,基于功能與和基因注釋的方法對于數(shù)據(jù)庫功能注釋信息的完善程度依賴性較大,如果數(shù)據(jù)庫中沒有足夠的功能域或基因注釋條目,那么將無法確定蛋白質(zhì)的亞細胞定位。

由于不同的特征從不同的角度刻畫蛋白質(zhì)序列,目前沒有一種特征能夠很好地刻畫蛋白質(zhì)的亞細胞定位特征,單獨利用某種特征難以在預測效果上取得大的突破。將多種特征提取方法組合起來已經(jīng)成為亞細胞定位預測中最為普遍的一種方法。

3 蛋白質(zhì)亞細胞定位預測算法

蛋白質(zhì)亞細胞定位預測中另一個重要因素是識別算法,成功的分類算法應該是能夠高效、正確的將不同亞細胞位置的蛋白質(zhì)分開。在蛋白質(zhì)亞細胞定位預測方面,主要的算法包括5類:基于簡單選擇判別規(guī)則的方法;基于距離度量的近鄰方法;基于人工神經(jīng)網(wǎng)絡的方法;基于馬爾可夫模型的方法;基于向量機的方法。常用預測方法有神經(jīng)網(wǎng)絡、支持向量機 、最鄰近算法三種。

(1)神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡是一種模仿動物神經(jīng)網(wǎng)絡行為特征,進行分布式并行信息處理的算法數(shù)學模型。這種網(wǎng)絡依靠系統(tǒng)的復雜程度,通過調(diào)整內(nèi)部大量節(jié)點之間相互連接的關系,從而達到處理信息的目的。神經(jīng)網(wǎng)絡具有良好的魯棒性和容錯性,因此,不僅在蛋白質(zhì)亞細胞定位領域受到青睞,在模式識別的其他領域也得到了廣泛的應用。

(2)支持向量機。支持向量機是一種基于統(tǒng)計學習理論分類技術,它在蛋白質(zhì)特征向量映射到的高維空間中,找到一個使(下轉(zhuǎn)第32頁)(上接第12頁)分類誤差最小的最優(yōu)分類面。由于支持向量機具有較好的推廣能力,許多學者選擇它作為蛋白質(zhì)亞細胞定位預測的首選分類器。

(3)基于距離的近鄰方法?;诰嚯x的近鄰方法原理是根據(jù)某種距離度量方法來度量樣本之間的相似性,距離越近則兩樣本有可能出現(xiàn)在相同細胞器中。隨后的研究中,研究者將基于距離的近鄰方法做了推廣,如模糊K近鄰方法,加權(quán)模糊K近鄰方法等。基于距離的近鄰方法,不需要人為的選擇參數(shù),適合求解大規(guī)模問題,運算速度較快。

隨著研究的不斷深入,將多種算法進行融合,來預測蛋白質(zhì)亞細胞定位已經(jīng)逐漸成為研究的趨勢。2010年,趙禹等用離散增量結(jié)合支持向量機方法預測蛋白質(zhì)亞細胞定位。多種算法的融合,在提高蛋白質(zhì)亞細胞定位預測的精度和加快算法運行速度方面取得了良好的效果。

4 預測算法的檢驗和評估

選用適當?shù)念A測算法之后,需要對算法進行評估,即檢驗出算法的準確率,它是評價一個分類算法性能好壞的重要指標,也是與其它分類預測算法比較的依據(jù)。預測算法的檢驗方法主要有自身一致性檢驗、獨立性檢驗、留一法檢驗三種[29]。

留一交叉驗證(1eave-one-outcross-validation,LOOCV)每次取出數(shù)據(jù)集中的一條蛋 白質(zhì)序列作為測試樣本,而剩余的蛋白質(zhì)序列作為訓練集對測試樣本的亞細胞進行定位預測。直到所有樣本序列都被測試一遍為止。LOOCV的缺點是計算成本高,費時,但是其結(jié)果更加嚴格可靠,已經(jīng)在很多方法中得到了應用。

評估預測算法常用的算法評價指標有 :敏感性、特異性和 Matthew相關系數(shù)。敏感性指標是指每類樣本中被正確識別的比例,反映了預測成功率;特異性指標是指被判別為第i類的樣本中真正屬于第i類的比例,反映了預測的可信度。

Sensitivity(i)=■×100%

Spencificity(i)=■×100%

Matthews相關系數(shù)MCC可以對算法的準確率進行評估。

MCC(i)=■

其中,tp(i)是第i類樣本中被預測正確的數(shù)目,fn(i)是第i類樣本被錯誤的判別為其他類別的數(shù)目,fp(i)是非第i類樣本但被預測為第i類樣本的數(shù)目,tn(i)是非第i類樣本中被預測正確的樣本數(shù)目。MCC指標取值0至1,取值越高說明分類器的性能越好,當MCC取1時,所有樣本均被正確識別;當MCC取0時,分類器的判別效果與隨機指派的結(jié)果一樣,這樣的分類器是最差的。

【參考文獻】

[1]徐建華,朱家勇.生物信息學在蛋白質(zhì)結(jié)構(gòu)與功能預測中的應用[J].J Med Mol Biol, 2005,2(3):227-232.

[2]張樹波,賴劍煌.蛋白質(zhì)亞細胞定位預測的機器學習方法[J].計算機科學,2009,36( 4):29-33.

[3]張麗.蛋白質(zhì)亞細胞定位的序列編碼及預測方法研究[D].湖南:湖南大學計算與通信學院,2010.

[4]郭麗麗,陳月輝.基于機器學習的蛋白質(zhì)亞細胞定位預測[J].信息技術與信息化,2011,5:73-75.

[5]吳文佳.蛋白質(zhì)亞細胞定位預測方法研究[D].南京:南京航空航天大學,2008.

第9篇:生物信息學概念范文

關鍵詞:信息論;哲學;本體論;自我

信息論的創(chuàng)始人申農(nóng)為解決通訊技術中的信息編碼問題,提出通訊系統(tǒng)的一般模型,發(fā)表了《通信的數(shù)學理論》《噪聲中的通信》兩篇論文,從而奠定了信息論的理論基礎。他指出“信息論(狹義的)的基本結(jié)果,都是針對某些非常特殊的問題的,它們未必切合像心理學、經(jīng)濟學以及其他一些社會科學領域?!盵1]因此,信息論分為廣義信息論和狹義信息論。狹義信息論即申農(nóng)早期的研究成果為主,它以編碼理論為中心,主要研究信息系統(tǒng)模型、信息的度量、信息容量、編碼理論及噪聲理論等。廣義信息論又稱信息科學,主要研究以計算機處理為中心的信息處理的基本理論,包括評議、文字的處理、圖像識別、學習理論及其各種應用。維納認為“信息既不是物質(zhì),也不是能量,信息就是信息,不懂得它,就不懂得唯物主義。[2]”雖然維納并沒有給出信息的確切定義,但卻第一次將信息科學映射到哲學問題上。

此后,信息科學的發(fā)展沖擊了20世紀下半葉以來的哲學思想路線,重新開啟了對哲學形而上問題的探討。雖然從物理角度來說,信息是按照一定的方式排列組合起來的信號序列,它借助于某種介質(zhì)作為通道來傳遞、加工和貯存。但是隨著現(xiàn)代科學技術的發(fā)展,信息科學技術建構(gòu)起了全新的語言環(huán)境、精神環(huán)境,“把我們從對事物的直接領悟中順順當當?shù)赝频接蛇壿嬮g隔隔開的世界中[3]”,使“知識源保持著一種抽象的控制論意義下的距離[4]”,從而消解了現(xiàn)實中的語言涵義。而現(xiàn)代人類依靠網(wǎng)絡空間高速傳播的思想,將世界空間縮小,人們憑借大眾傳播媒介或個人或組織給予的信息來建構(gòu)起世界的“腦海圖景”,并以此來判斷世界并給予回應。正如“洞穴”隱喻一般,真實移動的“實體”不再真實,而意識、信息構(gòu)筑的世界更“實際”,真實的世界成為“符號的宇宙”。哲學家海姆認為虛擬現(xiàn)實表現(xiàn)為七大特征:模擬性、交互作用、人工性、沉浸性、遙在、全身沉浸和網(wǎng)絡通信。正統(tǒng)哲學都是基于客觀實在現(xiàn)實性范疇框架內(nèi)的哲學,客體是意識的容器,在主體和客體之間具有明顯界限,而信息科學技術的發(fā)展,“電子化”的語言方式可快捷地掃描人的思想,意識的力量在某種程度上得以強化。由此,使我們不得不重新思考信息科學是否揭示并決定著我們對世界的認知和發(fā)問方式。

哲學本以人本意識為主,是自覺之自我的最高意識成就,它依賴于社會的發(fā)展而發(fā)展。在康德建立了系統(tǒng)完善的形而上學之后,尼采宣布了“上帝已死”,海德格爾對“自我”“存在”的考證也對人類自身發(fā)展做了完備的總結(jié),維特根斯坦認為“哲學僅余下的任務是語言分析!”,似乎哲學沒落到只囿于語言這一狹小領域,但信息科學技術的發(fā)展為自我、本體等哲學概念提出了重新思考的空間。信息科學在自身運動、發(fā)展的進程中,呈現(xiàn)出自身歷史的反映、自身性質(zhì)的規(guī)定、自身發(fā)展的種種可能性這三種自在、自為、再生的基本形態(tài),這三種關于事物歷史、現(xiàn)狀、未來的間接存在凝結(jié)在一個具有特定結(jié)構(gòu)和狀態(tài)的直接存在物中,這種直接存在的結(jié)構(gòu)和狀態(tài)被凝結(jié)著它的間接存在所規(guī)定。也即是說,自我、本體等概念被信息科學尤指信息技術、互聯(lián)網(wǎng)這一間接存在所規(guī)定。方東美先生認為:“希臘人把時間的體系化成空間的體系,然后再就時間來看,表面上是有過去、現(xiàn)在、未來的實踐連續(xù)性,而這個過去、現(xiàn)在、未來,都可以化成現(xiàn)在的影像。換句話說,是把真實現(xiàn)在變成空間化的現(xiàn)在,這樣就便于把過去的影像納入了現(xiàn)在,把未來的影像也以前瞻的方式把它收到現(xiàn)實當中,然后以一個空間化的現(xiàn)在籠罩一切過去現(xiàn)在和未來”[5]。這樣一種“了解時間的不重要,才是智慧之門[6]”,因此,哲學關于“我”、“本體”、“存在”等概念的思考由時間、空間的三維方向轉(zhuǎn)向一維的趨向。

此外,分析哲學家卡爾納普對語義信息的關注,將申農(nóng)的信息論引向人類領域,認為由于人的選擇、接受、記憶的選擇性存在,信息本身存在著解讀的很大不確定性和可能性,因此有主觀與客觀、低級與高級、自然與社會信息等之分。生物信息學認為生物信息包括遺傳信息、神經(jīng)――激素信息、代謝信息和人腦信息等多方面。物理學家T.Stonier在《信息物理學》提出的“信息子”認為“有組織就必然有結(jié)構(gòu),有結(jié)構(gòu)就必然有信息”。在信息N論中,信息不是具有“粒子性”的能夠構(gòu)成世界的“本原”,而是具有演繹性的能夠生成世界的“生元”,信息的“生成”特性使世界本體成為一種過程本體,也就成了一個信息集合體。這些在信息論基礎上發(fā)展起來眾多交叉學科,如量子信息學、生物信息學、物理信息學等等,他們都試圖從信息主義解釋萬物緣由的本體論論調(diào),暫且不論對錯,但其提供的視角也是一種哲學嘗試。雖然信息科學技術在某種程度上剝離了對生命的人文關懷,使其變得些許冰冷,但對一些哲學概念的分析給飄散在浩浩蕩蕩信息長流中的理論派別提供了一種更深層次、更基礎的思維范式,從而推及對人類、宇宙的認識。

(作者單位:四川省社會科學院研究生院)

參考文獻:

[1]鐘義信.信息科學原理[M].福建人民出版社,1988,26.

[2]N.維納.控制論[M].北京:科學教育出版社,1962,48.