新型コロナウィルスSARS-Cov-2ゲノム配列の一般公開を開始いたしました。
これまでGISAIDという国際コンソーシアムに集積されていました。
大学研究者にとっては膨大な量の国内外の配列にアクセスできる反面、企業の研究者は使いにくいという課題がありました。
この度、国立遺伝学研究所の有田正規教授、藤澤貴智特任研究員、ライフサイエンス統合データベースセンターの片山俊明准教授の協力を得てThe DNA Data Bank of Japan (DDBJ)からの公開を開始いたしました。
国内の他のSARS-Cov-2の研究機関からもGISAIDに並行してDDBJからの公開がすすむことを期待したい。
- 新型コロナウィルスSARS-Cov-2はRNAウィルスであり、RNA塩基としてはAUGCの4文字が使われています。データベース上の塩基配列の表記としてはUの代わりにTで表記することが国際的に慣習となっており、これに従っています。下記を参照ください。
https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi
GenBank format by historical convention displays mRNA sequences using the DNA alphabet. Thus, for the convenience of people reading GenBank records, the genetic code tables shown here use T instead of U. - DDBJ:配列の記載に用いる略号
https://www.ddbj.nig.ac.jp/ddbj/code.html#nucleotide-1