中性子による「半導体ソフトエラー発生率」の全貌解明は、地球上から宇宙まで、すべてのデジタルデバイスを守る鍵となる
日本電信電話株式会社(NTT)と北海道大学は、共同研究によって中性子の低エネルギー領域におけるソフトエラー発生率の測定に成功し、すでに2020年に成功していた高エネルギー領域における測定(北海道大学、名古屋大学およびNTTの共同研究)とあわせて、すべてのエネルギー領域での半導体ソフトエラー特性の全貌を世界ではじめて明らかにしました。この成果の実現においては、今回の研究で開発した高速エラー検出回路が大きな役割を果たしており、今後は社会インフラのシステムに重大な影響をおよぼす広範囲なエネルギーの中性子によるソフトエラーの防止に貢献していくことが可能になります。
https://group.ntt/jp/newsrelease/2023/03/16/230316a.html
どのようにしてこの研究を成功に導いたのか、そして将来的な展望について、プロジェクトに携わった3名に話を聞きました。
※所属は取材当時のものです。
岩下 秀徳(いわした ひでのり)
NTT宇宙環境エネルギー研究所 レジリエント環境適応研究プロジェクト
プロアクティブ環境適応技術グループ 主任研究員
専門は宇宙線ソフトエラー
広島 芳春(ひろしま よしはる)
NTT宇宙環境エネルギー研究所 レジリエント環境適応研究プロジェクト
プロアクティブ環境適応技術グループ
専門は電磁環境両立性
木内 笠(きうち りゅう)
NTT宇宙環境エネルギー研究所 レジリエント環境適応研究プロジェクト
プロアクティブ環境適応技術グループ 研究員
専門は宇宙線ソフトエラー
1. 宇宙からやってくる、目に見えない脅威
まず、今回の発表の概要についてお聞かせいただけますか?
岩下氏 私は今回の研究プロジェクトのリーダーを務めてきました。本研究は、宇宙線(太陽フレアや銀河から飛来する、宇宙からの放射線)の中性子が引き起こす「ソフトエラー」の発生率を、低エネルギー領域から高エネルギー領域にわたって測定し、その全貌について報告したものです。
私たちは2020年に、中性子の高エネルギー領域(1 MeV~800 MeV※1)におけるソフトエラー発生率の測定に成功しました(北海道大学、名古屋大学およびNTTの共同研究)。そして今回、低エネルギー領域(10 meV※2~1 MeV)における測定にも成功したことで、中性子のすべてのエネルギー領域におけるソフトエラー発生率の測定が実現しました。これらの測定結果をもとに、中性子が引き起こすソフトエラー発生率の「全貌解明」として報告しました。
※1 MeV=メガエレクトロンボルト。1 MeV=100万電子ボルト。
※2 meV=ミリエレクトロンボルト。10 meV=0.01電子ボルト。
中性子によるソフトエラーは、どのようにして発生するものなのでしょうか?
岩下氏 中性子は、宇宙線が地球の大気に衝突することで発生します。発生した中性子は、「中性子線」となって地上に降り注ぎます。中性子は非常に高い透過力を持っているため、地上に降り注ぐとビルなどを貫通し、電子機器の半導体デバイス(一般的にはシリコンで構成されている)に到達します。
通常、中性子はシリコンを通過しますが、時折、シリコンの原子核と核反応を起こすことがあります。中性子がシリコンの原子核と核反応を起こすと、電荷を帯びた粒子「荷電粒子」が生成されます。
半導体デバイスでは、情報は通常「ビット」として電気的に保存されていますが、荷電粒子によって、保存されたデータが書き換えられてしまうことがあります。このようにして起きるエラー現象は、実際にデバイスが破壊されたわけではなく、単に情報が書き換わっただけなので、ソフトエラーと呼ばれています。
ソフトエラーの対策としては、どのような方法がありますか?
岩下氏 ソフトエラーは、半導体のシリコンと中性子の相互作用が一定の確率に基づいて起こる「確率事象」です。従って、発生率がわからなければどの程度の対策を施せばよいのかがわからない事象です。
ソフトエラーに備えるためには、ソフトエラーによってデータが書き換わる確率と、それによって故障に至る頻度を想定した上で、半導体デバイスを設計する必要があります。とはいえ、ソフトエラーによる故障頻度は、デバイスに到達する中性子が持つエネルギーによって大きく異なります。従って、ソフトエラーの対策には、本研究で測定した中性子のすべてのエネルギー領域におけるソフトエラー発生率が重要になるのです。
今回の研究成果によって、確率事象であるソフトエラーの対策をより正確に講じられるようになることが期待できます。
2. ソフトエラーを測定する、10億分の1秒をとらえる技術
ソフトエラー発生率の測定方法についてお教えください。
岩下氏 ソフトエラー発生率には、エネルギー依存性(中性子が持つエネルギーごとのソフトエラー発生率)があります。従って、測定ではどのようなエネルギーを持つ中性子が、どれだけのソフトエラーを起こすのかを対応させる必要があります。
そのためには、まずソフトエラーを引き起こした中性子のエネルギーを特定する必要があります。これは中性子などを人工的に生成し、実験することのできる「加速器施設」で実証実験を行うことで測定します。
たとえば、今回の実験で使用した「J-PARC(大強度陽子加速器施設)」は、加速器を用いて荷電粒子(陽子)を生成します。陽子を特定のターゲット材料に短時間で照射することで、中性子が生成されます。このとき、エネルギーが異なる中性子が生成されますが、高エネルギーを持つ中性子は速く、低エネルギーを持つ中性子は遅い性質があります。これらのエネルギーと速度の相関を利用して、測定を行います。
まず、速度の異なる中性子をある一定の距離、飛行させます。すると高エネルギーで速い中性子の方が、低エネルギーで遅い中性子よりも短い時間でゴールへと到達します。この時間の違いを測定し、中性子の速度を算出、運動エネルギーに変換する手法「飛行時間法」を用いて、中性子のエネルギーを特定するのです。
続いて、どのようなエネルギーを持つ中性子が、どれくらいのソフトエラーを起こすのかを検出する必要があります。実験は、J-PARCと米国ロスアラモス国立研究所の「高出力800 MeV陽子線形加速器施設」で行いました。
ソフトエラーの検出を行うためには、非常に高速な検出回路が必要です。中性子は低エネルギーで遅いものであっても非常に速いので(ミリ秒オーダー)、発生から検出までの時間が長いと検出できないためです。そこで今回は、非常に高速な検出が可能なFPGA(Field Programmable Gate Array:実験などの用途に合わせて自在にカスタムが可能な集積回路)を使用した技術(超高速エラー検出回路)を開発しました。これにより、ソフトエラーが発生した時間をナノ秒単位(1ナノ秒=10億分の1秒)で検出することが可能になりました。
今回の測定で、特別な工夫が必要だった点などはありましたか?
岩下氏 測定の過程で苦労したところは、実験中に起きた不具合を自動回復する仕組みの実装です。ソフトエラーの実験では、「異常を起こしながら測る」という方法を採ります。
今回のJ-PARCの実験では、FPGAを加速器に入れ、ソフトエラーを10万回ほど起こす実験を行いました。同実験における中性子の照射時間は3日間にもおよぶため、さまざまな問題が発生する可能性があります。しかし、検出機が故障したり停止したりすると、肝心のソフトエラーが測定できません。
そこで、不具合を自動的に回復する仕組みを実装することになったのですが、この自動化のプロセスが大変でした。結果的には、自動化のプロセスによって測定中の故障や損傷を最小限に抑えつつ、継続的な測定を行うことが可能になり、より正確な結果を得ることができました。
3. ソフトエラーが引き起こす、デジタルエイジの大災害
ソフトエラーに備えることは、なぜ私たちの社会にとって重要なのでしょうか? 具体的な障害例などがあれば教えてください。
広島氏 私は2019年からソフトエラーの研究にかかわるようになりました。それ以前は、EMC(電磁環境両立性)に焦点を当て、有線および無線の電磁ノイズのなかで機器が最適な性能を発揮するかどうかを研究していました。
ソフトエラーによる障害は、たとえば通信ネットワークなど、社会インフラのシステムにおいて特に重大な影響をおよぼす可能性があります。通信ネットワーク内でソフトエラーが発生すると、単一の機器障害であっても、ネットワークは複数の機器で構成されているので、大規模な障害事象を引き起こしてしまう恐れがあります。
さらに現在、半導体は高集積化、微細化が進んでいることから、ソフトエラーの未然防止は重要な社会課題になっています。
半導体の高集積化や微細化が進むにつれて、ソフトエラー対策がますます重要な課題になるということですね?
広島氏 半導体の微細化によって、電子機器の回路や素子は非常に複雑になり、より密集した構造になります。そのため、ビットを保持する電荷量が下がるので、中性子などの粒子が素子内部に衝突したときに、ソフトエラーを引き起こす確率が高くなることも相まって、ソフトエラーが発生する頻度や範囲が増える可能性があるのです。
このような背景から、ソフトエラーの予防策や対策の重要性は一層高まっているといえます。たとえば、設計段階から回路の冗長性の確保やエラーチェック機構の強化、信号の耐性向上などの対策を講じることで、ソフトエラーによる機器の不具合や障害を最小限に抑えることが求められます。
具体的には、どのようにしてソフトエラー発生率を半導体や電子機器の設計に採り入れていくのでしょうか?
広島氏 NTTではソフトエラーを再現し、対策と効果の評価を行うことのできるソフトエラー試験技術を確立しています。2016年に開始した「ソフトエラー試験サービス」によって、故障率が規定の基準にかなっているかを設計段階から評価することが可能になりました。これにより、ソフトエラーに起因する故障に備える設計が行えるようになったのです。
おおまかな計算で、10年ほど前は、ソフトエラーに起因する故障はほかの故障に比べて、数十倍も多いという状況でした。そこでは当然、故障が発生した際の対策や交換のコストも発生していました。
現在はソフトエラー試験サービスの導入によって、ソフトエラーに起因する故障は、ほかの要因による故障よりも少なくなるように考慮して設計ができるようになりました。故障率を完全にゼロにすることはできませんが、可能な限り低く抑えることに成功しています。
4. 宇宙時代の情報インフラを支える
今後進めていく発展的な研究についてもお聞かせください。
木内氏 今回の研究で、私は実務面での役割を担当しました。ソフトエラーの発生確率を測定するための基板作成やFPGAの設計、実験の実施、結果の解析などです。
今後の応用としては、地上環境に限らず宇宙環境でのソフトエラーの研究を進めることを考えています。宇宙では主に荷電粒子で構成される宇宙線が飛び交っており、それが物質にあたることで中性子が放出されます。このような環境におけるソフトエラー対策にも、私たちの研究成果を活用することができると考えています。
今回の研究で測定したのは、半導体にどのようなエネルギーの中性子が入射すると、どれくらいのソフトエラーが起きるかの発生確率です。この発生確率は半導体の特性に依存するパラメータであることから、同じ地球でつくられた半導体であれば、たとえばほかの惑星や宇宙環境であっても、中性子の入射状況や環境さえわかれば、故障率を推定することが可能です。これをもとに、宇宙やほかの惑星における装置の設計をより堅固にすることができます。
たとえば、最近では「アルテミス計画」などで注目されている月、あるいは火星の探査ミッションにおいて、電子機器の故障率の算出は非常に重要です。今回の研究によって、過酷な宇宙環境下でも電子機器の故障を最小限に抑え、探査ミッションの成功を支えることができると考えています。
今回の研究を宇宙環境へも応用することで、どのような社会的な成果が期待できますか?
木内氏 NTTは「宇宙統合コンピューティング・ネットワーク」の実現に向けて動き出しています。
宇宙統合コンピューティング・ネットワークは、NTTのネットワーク・コンピューティングインフラと、スカパーJSAT株式会社の宇宙アセット・事業を統合することによって生まれる、宇宙空間を利用した新しい通信・コンピューターのインフラです。「衛星コンステレーション」と呼ばれる複数の衛星を協調・連携させるシステムを構築して、地上観測や情報通信のデータ処理を分散コンピューティングによって高度化します。この取り組みにおいて、電子機器のソフトエラー対策が重要となっています。
また宇宙環境では、中性子に加えて荷電粒子も電子機器へ侵入するためソフトエラーの因子となります。中性子起因のソフトエラーの発生確率と荷電粒子起因のソフトエラーの発生確率を明らかにすることは、宇宙における放射線のソフトエラー予測においても大きな意義があると考えています。
さらに、私たちは宇宙空間での放射線遮蔽について新たなアプローチを追求しています。特に、電磁バリアを活用した技術開発に注力しており、宇宙線の影響を効果的に低減するために、電場や磁場を利用して荷電粒子の軌道を制御する方法に取り組んでいます。
最後に、今後はどのような課題認識で研究に取り組んでいかれますか?
岩下氏 私は、もともと大学時代に中性子の研究に取り組んだ経験があります。その後、NTTの通信ネットワークを支える伝送装置開発に携わるなかで、大学時代の中性子の研究を役立てることができました。
2012年頃、導入された装置において謎の故障や障害が頻発する現象が発生し、問題について調査を進めるなかで、中性子が原因である可能性が浮上しました。この謎の現象が私のソフトエラー研究のはじまりです。今回の研究成果は、かつては謎だった故障を解明し、将来性のある研究を開拓できたという点において、大きなマイルストーンだと感じています。
広島氏 私は現在、ソフトエラーに加えて、ハードエラーの評価・対策にも関与しています。ハードエラーとは、中性子がハードウェアを通過して過電流が発生し、機器が破損することをさします。ソフトエラーとハードエラーの研究は、情報通信技術の発展と安定性を確保する上で非常に重要です。私たちは引き続き、実験を通じて新たな知見を得ると同時に、実用化に向けた取り組みを進めていく予定です。
木内氏 2022年にNTTに入社した後、エネルギー依存のソフトエラー発生確率や宇宙環境におけるソフトエラーの発生メカニズムなど、幅広い研究に取り組んでいます。この研究が情報技術分野において重要な成果を生み出し、社会に貢献することをめざして、今後もさらなる研究の展開と実用化に向けた取り組みを続けていきます。
日本電信電話株式会社外からの寄稿や発言内容は、
必ずしも同社の見解を表明しているわけではありません。
このオウンドメディアは、NTT宇宙環境エネルギー研究所がサポートしています。
宇宙環境エネルギー研究所では、社会課題の解決に向け多様な人材を募集しています。