> top > projects

Projects

NameTDescription# Ann. AuthorMaintainerUpdated_atStatus

461-480 / 592 show all
bionlp-st-ge-2016-test-tees NER and event extraction produced by TEES (with the default GE11 model) for the 14 full papers used in the BioNLP 2016 GE task test corpus.9.17 KNico ColicNico Colic2023-11-29Released
LitCovid-OGER Using OGER (http://www.ontogene.org/resources/oger) to detect entities from 10 different vocabularies9.31 KFabio RinaldiNico Colic2023-11-29Released
silkworm 9.87 KMasakazu SAGA2023-11-29Testing
silkwormbase 10 Ksakaniwa2023-11-29Testing
FA_Top107-forWeb ※※※ !要データ加工! webリンク用には、この結果を加工して使っています。その他で使われる場合に、末尾記載の問題を別途解決する必要があります。 !要データ加工! ※※※ Top100+本来Top100に入るべきだった7レビューの計、107レビュー中99レビュー。 5414, 6076, 6930, 8403, 9643, 12112, 18544, 18829は、0denotationでドキュメント自体登録していません。 @AikoHIRAKIはtypoを修正したレビューフォルダ。 attributesの詳細はconfig参照。 ※※※ !注意! webリンク側のしばりで、選択文字列は複数のUniProtIDに対応していません。(例)Protein1~Protein7とある場合、 Protein1, 2, 3, 4, 5, 6, 7をさし、かつ全てにUniProtIDがあったとしても、1と7のみUniProtIDをとってきています。 "~"は、Protein2, 3, 4, 5, 6を意味していますが、positionではなく文字列で検索をかけているのと、見せ方の仕様上、これらのIDは全て未取得となっています。⇔GeneProteinでは"~"に2-6のIDsをもたせていました。 該当レビュー;14898(~=MAPK2, MAPK3, MAPK4, MAPK5, MAPK6), 10471(~=Ago2, Ago3) --------------------------------------- (例)ProteinAB...ProteinCD...ProteinB...ProteinDとある場合、 ProteinABは、ProteinAとBというLexical_Cueになっています。ProteinCDも同様に、ProteinCとD。BとDだけでは、このレビュー内ではProteinBやProteinDをさすことが分かるのですが、それ以外で使用する場合に、BとDにそれぞれ該当UniProtIDをあてるのは不適切です。 該当レビュー;11957(β4=itgb4, β1=itgb1, β5=itgb5, β3=itgb3) 他の例が出てきたら順次、ここに記載していきます。当座、これらは削除する必要があります。 attributeで削除フラグをつけるか、Jakeの機能がTextAEに実装されれば解決するか、検討して、何かしら分かるようにしておきます。 (例)ProteinA/B とある場合、 webリンクでは、"ProteinA"にUniProtID-Aを、"/B"にUniProtID-Bをつけています(リンク側のしばり)。webリンク以外で使われる場合には、別プロジェクトのFA_Top100Plus-GeneProteinで行っていたようなRelationを使って、"/B"ではなく、"ProteinB"として、UniProtID-Bと対応させる必要があります。現状のとり方ですと、要Relation箇所は救済出来ません。 Lexical cueには"/B"とありますが、Objectには"ProteinB"と残してあるので、Objectを参照して下さい。 但し、言語処理のようなpositionがご入用な場合には上では対応出来ていません。 該当レビュー;11935(/4=BMP4), 14898(/2=LATS2), 7412(/2=TSC2), 4629(/2=CtBP2) (webリンクでは、レビュー毎に完結しているので、"/B"がそのレビューで他の意味をなしていなければ対応出来るのと、文字列合致でリンクを貼っているためです。) !注意! ※※※ RelationのmergedはTextAEの既存機能で既に出来ます。10.3 KAikoHIRAKI2023-11-29Beta
Zoonoses This is a main data sets of Zoonoses project used by PanZoora.10.3 KAikoHIRAKI2023-11-26Developing
FA_Top100Plus-GeneProtein Top100+本来Top100に入るべきだった7レビューの計、107レビュー中101レビュー。 5414, 6076, 6930, 8403, 9643, 18544は、0denotationでドキュメント自体登録していない。 attributesの詳細はconfig参照。 ドキュメントのソースDBが@AikoHIRAKIとなっているものはTypo修正がPubAnnotationの公式FirstAuthorsドキュメントに反映された段階で置き換えます。 10.4 Kyucca2023-11-29Uploading
test3 10.7 Kykyao2023-11-29
bionlp-st-cg-2013-training The training dataset from the cancer genetics task in the BioNLP Shared Task 2013. Composed of anatomical and molecular entities.10.9 KNaCTeMYue Wang2023-11-28Released
metamap-sample Sample annotation of MetaMep, produced by Aronson, et al. An overview of MetaMap: historical perspective and recent advances, JAMIA 201010.9 KAlan R AronsonJin-Dong Kim2023-11-27Testing
semrep-sample Sample annotation of SemRep, produced by Rindflesch, et al. Rindflesch, T.C. and Fiszman, M. (2003). The interaction of domain knowledge and linguistic structure in natural language processing: interpreting hypernymic propositions in biomedical text. Journal of Biomedical Informatics, 36(6):462-477.11.1 KRindflesch et al.Jin-Dong Kim2023-11-29Testing
Glycan-Motif 11.1 KISSAKU YAMADA2023-11-29Testing
CORD-19-SciBite-sentences 11.2 KJin-Dong Kim2023-11-26Testing
2015-BEL-Sample-2 The 295 BEL statements for sample set used for the 2015 BioCreative challenge.11.4 KFabio RinaldiNico Colic2023-11-28Released
uniprot-mouse Protein annotation based on UniProt11.5 KJin-Dong Kim2023-11-28Developing
EDAM-topics annotation for EDAM topics11.6 KJin-Dong Kim2023-11-29Testing
test2 12.3 Kykyao2023-11-29
EDAM-DFO annotation for EDAM terms for data, formats, and operations12.5 KJin-Dong Kim2023-11-29Testing
LitCovid-sample-Enju 13.1 KJin-Dong Kim2023-11-29Developing
LitCovid-PD-MONDO-v1 PubDictionaries annotation for disease terms - updated at 2020-04-20 It is based on MONDO Version 2020-04-20. The terms in MONDO are loaded in PubDictionaries, with which the annotations in this project are produced. The parameter configuration used for this project is here. Note that it is an automatically generated dictionary-based annotation. It will be updated periodically, as the documents are increased, and the dictionary is improved.13.4 KJin-Dong Kim2023-11-29Released
NameT# Ann. AuthorMaintainerUpdated_atStatus

461-480 / 592 show all
bionlp-st-ge-2016-test-tees 9.17 KNico ColicNico Colic2023-11-29Released
LitCovid-OGER 9.31 KFabio RinaldiNico Colic2023-11-29Released
silkworm 9.87 KMasakazu SAGA2023-11-29Testing
silkwormbase 10 Ksakaniwa2023-11-29Testing
FA_Top107-forWeb 10.3 KAikoHIRAKI2023-11-29Beta
Zoonoses 10.3 KAikoHIRAKI2023-11-26Developing
FA_Top100Plus-GeneProtein 10.4 Kyucca2023-11-29Uploading
test3 10.7 Kykyao2023-11-29
bionlp-st-cg-2013-training 10.9 KNaCTeMYue Wang2023-11-28Released
metamap-sample 10.9 KAlan R AronsonJin-Dong Kim2023-11-27Testing
semrep-sample 11.1 KRindflesch et al.Jin-Dong Kim2023-11-29Testing
Glycan-Motif 11.1 KISSAKU YAMADA2023-11-29Testing
CORD-19-SciBite-sentences 11.2 KJin-Dong Kim2023-11-26Testing
2015-BEL-Sample-2 11.4 KFabio RinaldiNico Colic2023-11-28Released
uniprot-mouse 11.5 KJin-Dong Kim2023-11-28Developing
EDAM-topics 11.6 KJin-Dong Kim2023-11-29Testing
test2 12.3 Kykyao2023-11-29
EDAM-DFO 12.5 KJin-Dong Kim2023-11-29Testing
LitCovid-sample-Enju 13.1 KJin-Dong Kim2023-11-29Developing
LitCovid-PD-MONDO-v1 13.4 KJin-Dong Kim2023-11-29Released