ビッグデータ解析法の開発|将来気候に適応するイネ品種の選抜法

掲載日2023.07.27
最新研究

農学部 植物生命科学科
教授 下野 裕之
作物学

岩手大学農学部下野裕之教授らの研究グループは、将来の気候条件での持続可能な食料供給の達成に向け、イネをはじめ作物の品種改良を迅速化?効率化するため、ビッグデータ解析法「YpCGM法」を開発しました。この成果は、英国のNature姉妹誌「Communications Biology」2023年7月21日付(日本時間午後10時)に掲載されました。本研究で開発した手法は世界各国で蓄積されたイネ、コムギ、トウモロコシ、ダイズなど作物のビッグデータへの適応による育種への利用が期待されます。

発表のポイント

  1. 新手法の開発:イネ品種が持つ単位土地面積当たりの生産性(収量)(注1)を数理モデル(注2)で算出した潜在収量から評価する手法を開発しました(図1)。
  2. 日本のイネ237品種の収量性の評価:北海道から九州までの110か所で過去38年に237品種を栽培した72,510セットのイネ収量ビッグデータ(注3)について解析し、品種特性を2つのパラメーターで定量化しました(図2)。
  3. 日本のイネ品種の収量性の改良:本手法を用いた品種特性のパラメーター解析から、1920年から2017年までの品種改良によりイネ品種の収量性が10年で10.2kg/haのスピードで向上した点、興味深い点として、実際に利用する生産者は環境がよくなったときに収量を高める性質(可塑性)が高い品種を利用している点を明らかにしました(図3)。
  4. 前述の可塑性に関わる新規遺伝子領域の特定:収量の可塑性αを支配する新規遺伝子領域を第10染色体上にみいだしました(図4)。

背景

私たちの豊かな生活は、安定した農業生産に支えられています。世界の主要作物(イネ、コムギ、トウモロコシ)の収量(単位土地面積当たりの生産性)は1960年以降に2~3倍以上に増加し、これには品種改良が大きく貢献しています。品種改良といえば、 DNAや遺伝子の評価(ジェノタイピング、genotyping)が注目されがちですが、それにも増して重要なのが、その品種が持つ能力の正確な評価(フェノタイピング、phenotyping:ある品種が持つ能力は、これまでの従来の品種よりも高いのかの評価)です。前者のDNAや遺伝子の評価(ジェノタイピング)が次世代シークエンサーなど高度の技術革新により効率化されているのに対し、後者の品種が持つ収量性の評価(フェノタイピング)はいまだ野外フィールドでの栽培試験が世界標準のスタンダードの評価方法であり続け、品種改良のボトルネックとなっています。
栽培試験による収量の評価の利点は、導入する地域での気象条件で実際に評価することで品種の能力を正確に予測できる点です。一方で欠点は、得られる収量データは評価した環境に依存する点です。結果、品種を比較した試験結果がビッグデータとして蓄積していても、同じ年次に同じ地点で行ったデータ同士しか比較ができません。1年に1回、多大の労力と時間をかけて貴重な野外フィールドでの栽培試験の結果がうまく利用できず、品種改良のスピードを制約しています。地球温暖化による気候変動が拡大する中、蓄積されたビッグデータの効率的な利用方法の開発が必要です。そこで、開発したのが本手法です。
わが国は、国土が南北に長く、それぞれの気候に適した品種が育成、栽培されています。例えば、北海道は「ななつぼし」、東北地方では「ひとめぼれ」、北陸地方では「コシヒカリ」、九州地方は「ヒノヒカリ」などがありますが、それら主要品種を超える新たな品種育成が日々行われています(岩手県の「銀河のしずく」、山形県の「つや姫」、青森県の「晴天の霹靂」)。イネをはじめとする作物の品種改良には、有用な母本の交配からはじまり、その後、後代の系統を評価、選抜する過程に10年弱の年数を要します。気候変動が拡大する中、10年先を見通した交配母本の選択が必要です。本研究は、蓄積されたイネの収量のビッグデータを再解析することで、貴重なデータをアップサイクル(upcycle)し、気候変動に適応した新たな品種育成のための有望な品種を選抜することで先を見通した有用な母本の選択に役立てる手法を開発しました。
本研究成果は、従来、収量はある基準品種との相対値としてしか表現できなかったものを、本手法によりイネ品種の収量という特性を数理モデルを用いてわずか2つのパラメーターに一般化することに成功しました。ビッグデータを利用することで、時間と労力が必要な野外フィールドでの調査を行わずに、データ解析のみから埋もれていた全国の有用な品種の発掘、また関連する新たな遺伝子領域の発見も可能となりました。

研究内容

岩手大学作物学研究室の下野教授は、イネの成長を数理モデルで評価する手法を開発しました(図1)。y軸に実測のそれぞれの品種の収量をとり、それぞれの収量が得られた気象情報から数理モデルで算出した潜在収量をx軸にプロットすると、単純な線形回帰でできることを明らかにしました。この線形回帰の切片と傾きが品種のもつ収量特性として評価することができるという、YpCGM法を提案しました(ポイント1)。切片を収量性(yield-ability,β; t/ha)、傾きを可塑性(yield-plasticity,α; dimensionless)と提起しました。なお切片は、x=0での切片ではなく、多数の品種が経験した潜在収量x=8t/ha=SPYとしました。

開発した手法を用いて、下野教授は、日本のイネ237品種(110か所で過去38年)のビッグデータ72,510セットについて解析を行った結果、品種特性を2つのパラメーター、収量性(yield-ability,β; t/ha)には、2.5t/ha~7.3t/haの変異が、可塑性(yield-plasticity,α; dimensionless)には-0.23~0.95までの変異があることを明らかにしました(図2ab)(ポイント2)。さらに、それら品種のパラメーターを品種の育成年次との関係でプロットしてみると、正の相関関係が収量性βについてみられ、育種過程により、年あたり10.2kg/haのスピードで改良が進んでいることを示します(図2c)(ポイント3)。また、その中で生産者が好む主要品種についてみると、その傾きは21.8kg/haとほぼ2倍に高くなり、生産者はより収量性の高いものを好むことが示されました。さらに、環境に対する収量の可塑性αについては、育種家は積極的には選抜を行っていないけれど、生産者は、生産性だけでなく、可塑性が高い品種を選んでいることを初めて明らかにしました(図2d)。このことは将来気候への適応のための育種の目標としての可塑性αの重要性を示唆します。

ゲノム情報を用いて、岩手生物工学研究センターの阿部博士は、これら2つのパラメーターについてゲノムワイド関連解析(Genome wide association study)を91,800SNPsを用いて行うと、可塑性に関わる新規遺伝子領域を第10染色体上にみいだすことに成功しました(図3a)(ポイント4)。 第10染色体の中でも3,157,567~3,160,342bが強くかかわることが明らかになりました(図3de)。
なお、解析を進めるうえで、イネ収量ビッグデータには8000品種以上のデータが蓄積されていますが、詳細なゲノム情報を用いた解析を行うために、品種数を絞る必要があります。東京大学の岩田教授は、(株)夷風凛凛の佐藤氏がとりまとめた日本のイネ14,032品種の系譜関係について解析を行い、日本のイネを形作る代表237品種を選定しました。岩手生物工学研究センターの阿部博士は、その237品種について、DNAシークエンスを行い、品種間の違いをDNA上のマーカーとして91,800 SNPs(注4)を特定しました。東京大学の岩田教授また岩手大学の金准教授(当時)はこれらパラメーターが遺伝的な形質である点をゲノミック予測から確認しています。
提案した手法YpCGM法は、労力と時間を要する収量調査をすることなく、データを再利用(upcycle)することで、新たな視点を提供でき、今後の品種改良を効率化させることに役立つことが期待されます。

共同研究グループ

岩手大学:下野 裕之(農学部 教授)、金 天海(理工学部 准教授、当時)
東京大学:岩田 洋佳(農学生命科学研究科 教授)
岩手生物工学研究センター:阿部 陽(ゲノム育種研究部、 主席研究員)
(株)夷風凛凛:佐藤 睦志(代表取締役)

掲載論文

掲載誌:Communications Biology: 6, 764 (2023).
論文名:Upcycling rice yield trial data using a weather-driven crop growth model
公表日:2023年7月21日付(日本時間午後10時)掲載
著者:下野裕之(岩手大学)、阿部陽(岩手生物工学研究センター)、金 天海(岩手大学)、佐藤 睦志((株)夷風凛凛)、岩田 洋佳(東京大学)
DOI番号: https://doi.org/10.1038/s42003-023-05145-x

本研究は科研費?基盤研究A(「イネの野外ビッグデータを用いた「人工知能」による育種プラットフォームの開発」、2019-21年、19H00938)の支援を受け実施しました。


用語説明

  1. 収量:単位土地面積当たりの生産性 t/ha, kg/10a.収量を高めることは限りある耕地からより多くの収穫物を得ることにつながる。産業革命以降の急激な世界人口の増加は、世界の栽培面積の増加ではなく、収量の増加に強く寄与しており、今後2050年に90億人に達することが予測される世界人口を扶養するにはさらなる収量の増加が望まれます。
    作物育種において、「収量」は最も重要な目標形質ですが、ある品種の収量は、花の色や形などの形質とは異なり、環境より変動します。たとえば、品種「ひとめぼれ」の収量は、岩手県盛岡市で2021年に栽培した場合と2022年に栽培した収量で異なります。また同一年2021年でも盛岡市で得られる「ひとめぼれ」の収量は札幌市や那覇市で栽培した場合とも異なります。その違いを生む要因として、気象条件の違いがあげられます。その中でも水ストレスが少ない湛水条件で生育するイネは、日射量と温度の違いに強く影響を受けます。収量という形質は、イネは野外のある地点、ある年次に生育させて得られるものであり、「ある品種の収量特性は?」という問いに答えるのが極めて難しく、工業製品のように一律の条件で一定の基準で評価できるものとは一線を画します。
  2. ビッグデータ:全国110か所で1980年から2017年までの38年間に公立農業試験場で得られた8,524品種を用いた計207,331データセットのイネ収量データ(奨励品種決定試験データベース、農研機構提供)。なお、収量データは全国統一の栽培方法で適切に管理し得られた。
    数理モデルでの解析には、気象データの入力値が必要で、日平均の気温と日射量、計1億5300万データセット(365 days x 38 years(1980~2017)×110 locations)(MeteoCrop database (https://meteocrop.dc.affrc.go.jp/real/top.php))
    DNAにおける91,800 SNPsの多型情報。
  3. 数理モデル=成長モデル:イネの成長を数式化し、日々の気象データを入力することで、コンピューター上で仮想イネをそれぞれの環境で算出することが可能に、いわば仮想の基準品種の収量を「潜在収量」として、それぞれの収量が得られた環境について算出しました。たとえ話として、ある個人の走る能力を定量化したいとします。走る場所や気温などの天気、また距離によっても、その人の走るタイムは異なります。そこで一定の能力を設定した「仮想の伴走者」をコンピューター上で設定し、その「仮想の伴走者」のタイムに対して、その対象となる人が走るタイムとの関係をみることで、その人の能力を評価するようなイメージになります。ここではイネの収量、それを得られた環境での数理モデルで予測される「潜在収量」の関係になります。
  4. SNP(スニップ):一塩基多型(いちえんきたけい)。イネの設計図ゲノムDNAの塩基配列の中で、品種間で異なる塩基の1塩基での違い。これによりイネの収量の品種間差が生じる。
研究内容に関するお問い合わせ

岩手大学 農学部 植物生命科学科 作物学研究室 教授
岩手大学 次世代アグリイノベーション研究センター センター長
下野裕之
TEL/FAX 019-621-6146
Email shimn <アット> iwate-u.ac.jp (アットを@に変えてください)