ASxNSYSU | 2022 Taiwan Marine Bioinformatics Practical Workshop
中研院x中山 | 2022 台灣海洋生物資訊實用工作坊
時間地點:
12/07 (三) 14:00–16:00 | 中研院生化所 209
12/08 (四) 09:00–17:00 | 中研院跨領域 A303
參加單位:
中央研究院細胞與個體生物研究所 (中研院細生所)
中央研究院生物多樣性研究中心 (中研院生多中心)
國立中山大學海洋生物科技暨資源學系 (中山海資系)
課程講者:
呂在明 | 中研院細生所 | Lab website
林梅芳 | 中山海資系 | Lab website
駱乙君 | 中研院生多中心 | Lab website
課程助教:
Isabel Liao | 中研院生多中心
參加人數:
11 人 (研究助理x5, 碩士研究生x3, 博士研究生x1, 博士後研究員x2)
課程表
詳細課程表:https://sgel.biodiv.tw/program
時間 課程內容
12/07 (三) 14:00–16:00
Basic Linux command
12/08 (四) 09:00–12:00
Introduction
Working environment (Linux server)
Bulk RNA-seq (corallimorpharian algal-infection dataset)
de novo assembly, assembly statistics
Read mapping
Lunch break (lunch boxes)
12/08 (四) 13:00–17:00
Python and programming basics
Single-cell RNA-seq (coral larval settlement dataset)
Differential gene expression
Gene annotation
Gene set enrichment analysis
Notes:
課程接束後請將實作筆記放到 Google Drive 與大家分享 | https://drive.google.com/drive/folders/1jKLbcz7CNzCPNo2_4HXDFNSrWmGhVw1u
課程結束後請在 Google Forms 提供本次工作坊的反饋與意見 (課後問卷調查)
課程資料
Introduction to Linux command-line interface (在明) | https://drive.google.com/file/d/1TVxwS_Te4OQ57vHN-A09YTenDCKYBzQG/
課程投影片 (梅芳) | https://docs.google.com/presentation/d/1llchmblmDYeUA1Nv9lCj_GLyOLfOIkda/
Evernote 常用 markdown 語法 | https://sgel.biodiv.tw/markdown
實作講義 (乙君):
實作 1 | 登入實驗室伺服器 Login to the lab server | https://sgel.biodiv.tw/01_login
實作 2 | 轉錄體組裝與註解 Transcriptome assembly and annotation | https://sgel.biodiv.tw/02_assembly
實作 3 | 定序序列比對 Mapping reads | https://sgel.biodiv.tw/03_mapping
實作 4 | 基因本體分析 Gene ontology analysis | To be released upon request
Crash Course: Object Oriented Programming (Isabel)
數據資料
NCBI BioProject
https://www.ncbi.nlm.nih.gov/bioproject/PRJNA516370
練習資料 GitHub:
https://github.com/MeiFangLin/TW_bioinfo_2022
The subset for assembly (Illumina HiSeq 2500)
Control-1: SRR8470268. Control_stage3 (F2R3)
Control-2: SRR8470253. Control_stage3 (C2R3)
ExperimentC-1: SRR8470259. ExpC_stage3 (E1R3)
ExperimentC-2: SRR8470256. ExpC_stage3 (D2R3)
ExperimentD-1: SRR8470262. ExpD_stage3 (E2R3)
ExperimentD-2: SRR8470265. ExpD_stage3 (F1R3)
Complete set for DGE
GSE125433_allCounts_S003.txt
Full assembly (nucleotides)
Transcriptome_c1_k6.fasta
Full assembly (amino acids)
Transcriptome_c1_k6.fasta.transdecoder.pep
參考資料
常用程式
FASTQC: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Trimmomatic: http://www.usadellab.org/cms/?page=trimmomatic
Trinity: https://github.com/trinityrnaseq/trinityrnaseq/wiki
Assemblathon: https://assemblathon.org/
EMBOSS: https://emboss.sourceforge.net/
TransDecoder: https://github.com/TransDecoder/TransDecoder
Kallisto: https://pachterlab.github.io/kallisto/
BUSCO: https://busco.ezlab.org/
GO_MWU: https://github.com/z0on/GO_MWU
封面圖片 | 生命構成第一號:海星第一染色體 (Life Composition I: Starfish Chromosome 1)
我們的生命是由能量所構成,這些能量的聚集產生了數位訊息,以化學結構的方式儲存,我們稱之為遺傳密碼,也就是我們熟悉的 DNA。 DNA 由四個密碼字母 A、C、T、G 所構成,在人類細胞裡,這些密碼濃縮記錄在 23 對染色體上。DNA 的存在讓所有生物可以在宇宙這能量場中相互傳遞訊息與能量,成為感受平靜與溫暖的載體。藉由先進的基因定序技術,我們可以讀取這些密碼字母,從中了解到生命能量流動與演化的過程。
這一幅作品呈現了英國達爾文演化樹定序計畫中海星 (學名 Asterias rubens) 的第一染色體,藍色圓點顯示了基因的「GC 含量」,而黃色圓點則顯示了 「跳耀基因水平」。看似無序,但是「GC 含量」和「跳耀基因水平」與基因表現的調控有直接的關係,在這看似無序的圖形之下,生命有其極精密的運作秩序。
x