DSTEP

教育プログラムについて

近年、次世代シークエンサーに代表されるハイスループット機器解析の発達により、急速に集積する医療ゲノム関連バイオビッグデータを活用した高度データ解析を必要とする課題に即応できる人材は、アカデミアのみならず、関連産業分野の企業でも不足しており、課題解決能力の備わる高度な人材の発掘・育成や企業研究者の再教育を促進する仕組みを創出することは喫緊の課題となっています。

DSTEP (Data Scientist Training/Education Program) では、バイオに関連したさまざまな企業からなるコンソーシアムや、学内運営機関として設置された社会連携講座との連携により、データサイエンスのより実践的な問題設定について、その問題解決に即戦力となる人材の育成を目的としています。

専攻連携教員が所属する学外研究組織や、コンソーシアムに参加する関連企業との連携により、実践的なOn the Job Trainingを経験することが期待されます。

お知らせ・イベント

参画企業一覧

受講要件

受講資格

DSTEPは博士課程学生が3年間で実施する教育プログラムで、応募は博士課程への入学時のみです。本プログラムへの応募は指導教員の許可を前提とします。

選抜方法

プログラム受講生の募集は半期ごとにプログラム運営委員会が行い、提出された「学位研究課題提案書」に対する書面審査、また口頭試問によりプログラム受講を認定する。

課題募集・各種書式

2025年度プログラム受講者(A群)を募集します(公募期間:2025年10月14日~2025年11月4日)

2025年度プログラム受講者(B群)を募集します(公募期間:2025年10月14日~2025年11月4日)

プログラム概要

プログラム修了要件

・DSTEP-B (生物背景)

必修科目「データサイエンス実践演習Ⅰ~Ⅲ」に加えて「バイオデータプログラミング演習Ⅰ」を必修とし、選択必修科目より4単位(計8単位)履修する。本学の情報系科目をDSTEP選択科目に振替えることができる。

・DSTEP-I (情報背景)

必修科目「データサイエンス実践演習Ⅰ~Ⅲ」に加えて「バイオデータプログラミング演習Ⅰ」および「バイオデータプログラミング演習Ⅱ」を必修とし、両専攻が指定する基礎医科学・生物系科目群から2科目を(計7単位)履修する。

プログラムコア科目

科 目 名単位
1バイオ機能情報解析学1
2創薬データサイエンス概論1
3バイオデータプログラミング演習I1
4バイオデータプログラミング演習II1
5創薬データサイエンス演習1
6ドラッグデザイン特論2
7データサイエンス実践演習I1
8データサイエンス実践演習II1
9データサイエンス実践演習III1

プログラムコア科目の内容・特色

1.バイオ機能情報解析学

大規模生命データを駆使した最先端研究をわかりやすく俯瞰する。
授業テーマ
第一回 製薬企業での研究開発
第二回 システム生物学・がん
第三回 コホート・難病
第四回 精神疾患・血液腫瘍

2.創薬データサイエンス概論

次世代シークエンサー解析の方法論等、初等的な基礎について解説する。
授業内容
1. ゲノム
2. トランスクリプトーム
3. エピゲノム
4. ロングリード
5. メタゲノム
6. データベース
7. GWAS
8. シングルセル+空間オミクス

3.バイオデータプログラミング演習I

必要に迫られてプログラミングを書籍で独学すると基礎知識の不足に悩むことが多い。
本演習ではそのような学生が過去に躓いたポイントを調べ、必要な基礎知識を大量に補った独自のオンラインプログラミング学習教材を作成した。
生物学・医科学のプログラミングに必要な概念をゼロから広く浅く学び、研究に必要な高度なプログラミングを将来的に独学できるような「基礎体力」を養う。
初学者は大量の自習が必要である。

4.バイオデータプログラミング演習II

先駆的に開発され試用が開始されている情報解析ツール群を用い、その利用法について、実データを用いた実践的演習形式で習熟する。
生物学的に解析意義をもった実データに対して、データの抽出と解釈、それぞれの目的に即した考慮条件およびパラメーター等の解析条件を最適化する手法を習得する。

5.創薬データサイエンス演習

企業へのインターンシップ、若手研究会への参加、医療機関における医療現場のデータ処理を実地に体験する演習を実施する。
のべ4日間程度にわたり履修学生を派遣し、短期的課題をこなす演習形式で行う。

6.データサイエンス実践演習I-III

I~IIIは、履修開始一年次から三年次までの各年度の必修科目として設定され、提案課題の採用のための評価 (I) や進捗度合い (II, III) を筆記試験、口頭試問としてそれぞれ合否判定する(Qualifying Examination (QE)として機能する)。

授業詳細

創薬データサイエンス概論(A1・A2ターム、集中、木金4・5限)

担当教員:鈴木 穣・鈴木 絢子・片山 量平・関 真秀
場所:オンライン講義(詳細はUTASをご覧ください)

日程授業内容講師
10月16日4限第一回 ゲノム中谷 明弘
5限第二回 トランスクリプトーム関 真秀
10月17日4限第三回 エピゲノム鈴木 絢子
5限第四回 ロングリード関 真秀
10月31日4限第五回 メタゲノム西嶋 傑
5限第六回 データベース山下 理宇
11月6日4限第七回 GWAS鎌谷 洋一郎
5限第八回 シングルセル+空間オミクス鹿島 幸恵

創薬データサイエンス演習(A1・A2ターム、金3-5限)

担当教員:鈴木 穣・鈴木 絢子・片山 量平・関 真秀
場所:オンサイト (詳細はUTASをご覧ください)

日程授業場所講師
11月21日3~5限国立がん研究センター EPOC山下 理宇
11月28日3~5限バイオバンクジャパン松田 浩一
12月12日3~5限がん研究会有明病院片山 量平
12月26日3~5限DBCLS ライフサイエンス統合データベースセンター五斗 進

バイオ機能情報解析学(A2ターム、火4・5限)

担当教員:鈴木 穣・関 真秀
場所:オンライン講義(詳細はUTASをご覧ください)

日程授業内容講師
12月2日4限「製薬企業での研究開発の流れとバイオ機能情報の活用」髙野 佑真
中外製薬株式会社
5限「ゲノムデータを活用した医薬品製造の社会実装」小野寺 圭一
富士フイルム株式会社
12月9日4限「一細胞・空間オミクス解析のための深層生成モデリング」(仮)小嶋 泰弘
国立がん研究センター
5限「がん前臨床薬理モデルにおけるマルチオミックス解析の活用」大橋 紹宏
国立がん研究センター
12月16日4限「ToMMoが実施する前向きゲノムコホートの進捗」勝岡 史城
東北メディカル・メガバンク機構
5限「遺伝性疾患のゲノム解析」河合 洋介
国立健康危機管理研究機構
12月23日4限「精神疾患モデル動物研究の現在」森 大輔
名古屋大学脳とこころの研究センター
5限「感染症、がんを対象としたマルチオミクス解析と治療薬開発」山岸 誠
東京大学新領域創成科学研究科

バイオデータプログラミング演習I(S1ターム、水3・4限)

担当教員・講師:笠原 雅弘
場所:理学部3号館 412または新領域情報生命科学実験棟 201/オンライン講義
日程:2025/4/23、5/7、5/14、5/21、5/28、6/4

授業内容
初回チュートリアル / プログラミング言語の分類と選択 / エディタの基本的な使い方
コンピューターの基本的な仕組み / UNIXコマンドライン / ソフトウェアのインストール方法
Pythonの基本制御構造・関数 / Pythonのクラス / 文字列処理 / PythonでCSV/TSVファイルを処理
正規表現 / JSONとXML
PythonのモジュールとPyPI / 関係データベースとSQL
Rの変数・基本制御構造と関数 / Rのリスト・行列 / 整然データ
集計とグラフ描画 / 統計検定
Rのパッケージ / Bioconductorの紹介 / Jupyter
バージョン管理
テストと継続的インテグレーション
SSHと遠隔サーバーの使い方 / 分散ファイルシステム
バッチジョブキューシステム
ワークフローと再現性
復習と試験(最終実技試験は5月以降いつでも受けることができる)

バイオデータプログラミング演習II(A2ターム、木4・5限)

担当教員:関 真秀・鈴木 絢子・中谷 明弘・鹿島 幸恵
場所:オンライン講義

日程授業内容講師
11月27日4・5限1. 計算機環境の説明、オミクス解析準備関 真秀
12月11日4・5限2. オミクス解析(トランスクリプトーム・エピゲノム)関 真秀
12月18日4・5限3. GWAS鎌谷 洋一郎
12月25日4・5限4. ロングリード解析鈴木 絢子
1月8日4・5限5. シングルセル解析 基礎鹿島 幸恵
1月15日4・5限6. シングルセル解析 発展鹿島 幸恵
1月29日4・5限7. テスト関 真秀

科目等履修生

プログラムコア科目1~6については新領域創成科学研究科の大学院科目等履修制度による学外履修が可能。
科目履修生の募集について

プログラムアドバイザー制度

プログラム履修生の学位論文研究指導は、指導教員による直接指導および、各専攻におけるアドバイザー制度などの学位取得支援制度を併用する。また、その他に1名以上のプログラムアドバイザーをプログラム運営委員会が指定する。

リンク