「諦聴」地震波大規模言語モデル(LLM)が28日、四川省成都市で発表された。同LLMは国家スパコン成都センター、中国地震局地球物理研究所、清華大学が共同開発した、初の1億パラメータ数地震波LLMだ。
成都スパコンセンター運営管理有限公司の郭黎会長によると、同センターと中国地震局地球物理研究所は2023年9月に「地球LLMイノベーション応用共同実験室」を共同建設し、清華大学や中国科学院地質・地球物理研究所と共同で「諦聴」地震波LLMのトレーニングを開始した。「諦聴」データセットは中国初で、中国の内外で現在最大規模で、サンプルの種類と注釈が最も全面的な地震学専門AIトレーニングデータセットの一つだ。実験室の研究者は半年以上に渡り「諦聴」データセットを利用し、初の1億パラメータ数の地震波LLMを手にした。
中国地震局地球物理研究所の陳石氏は、「地震学は観測科学だ。長期的に見ると、重大なブレイクスルーは観測データへの深い理解から得られることが多い。伝統的な方法と中小規模のモデルでは現在、100TBや1000TBレベルの地震観測データをフル活用できないが、これらのデータは地震学の研究に対して重要な意義を持つ。LLMによって深く掘り起こすしかない」と説明した。
陳氏は、「『諦聴』LLMは大量のデータを利用し、先進的なAI技術を通じ、すでに地震波の識別の精度とペースを大幅に上げている」と述べた。
「中国網日本語版(チャイナネット)」2024年7月31日