[전자신문] 코로나 예측 Dataset ( kaggle, bioRxiv, RCSB,,, )
# keypoint
-
주 활동 지역, 특정 집단 관련, 감염 경로, 감염 차수, 방문 장소 등 세분화한 정보를 포함한 데이터를 투입해 인공지능(AI) 기술로 코로나19 확진자와 사망자를 예측하는 '코로나19 데이터셋'을 기계학습 기반의 예측 모델·분석 대회 플랫폼 'Kaggle'에 등록.
-
이 Dataset으로 확진자 나이와 성별, 질병 여부에 따른 회복 및 사망 예측이 가능하며, 확진자 특성에 따라 군집(클러스터링)을 만들거나 이상치 탐지로 슈퍼전파자 등 특이한 확진자를 분류가능.
# 참고 사이트 : https://www.kaggle.com/
Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
www.kaggle.com
# 참고 : https://www.etnews.com/20200306000213?mc=em_001_00001
韓 대학원생 '코로나 예측 데이터셋' 세계 배포
코로나19 확산을 막기 위해 데이터가 활용된다. 데이터를 투입해 인공지능(AI) 기술로 코로나19 확진자와 사망자를 예측한다. 특히 데이터 원재료를 한국 대학원생이 만들어 세계에 배포한다. 기계학습 기반의 예측...
www.etnews.com
# keypoint : 백악관이 글로벌 연구기관 및 관련 커뮤니티를 위한 세계 최대 코로나19(CORD-19) 데이터 세트를 오픈 소스로 3월 16일(현지시간) 공개.
CORD-19 데이터 세트는 29,000 개가 넘는 기사와 함께 13,000 개 이상의 전문이 포함된 가장 광범위한 기계 판독 가능 코로나 19 문헌 컬렉션으로 구성되어 있다. 또 이러한 수천 개의 기사를 선별하기 위해 마이크로소프트의 웹 규모의 문헌 큐레이션 도구가 사용되었으며, 알렌 AI 연구소 팀은 컨텐츠를 기계가 읽을 수 있는 형태로 변환하여 코퍼스(대규모 말뭉치)를 분석하고 연구
# 참고 논문 : https://connect.biorxiv.org/relate/content/181 (코로나 관련 논문)
bioRxiv COVID-19 SARS-CoV-2 preprints from medRxiv and bioRxiv
Munster, V., Feldmann, F., Williamson, B., van Doremalen, N., Perez-Perez,, L., Schultz, J., Meade-White, K., Okumura, A., Callison, J., Brumbaugh, B., Avanzato, V., Rosenke, R., Hanley, P., Saturday, G., Scott, D., Fischer, E., de Wit, E.
connect.biorxiv.org
# 참고 : http://www.aitimes.kr/news/articleView.html?idxno=15726
[초점] 美 백악관, 세계 최대 '코로나19(CORD-19) 데이터 세트' 오픈 소스로 공개 - 인공지능신문
백악관이 글로벌 연구기관 및 관련 커뮤니티를 위한 세계 최대 코로나19(CORD-19) 데이터 세트를 오픈 소스로 지난 16일(현지시간) 공개했다. 또 이 데이터 세트는 알렌 AI 연구소(Allen Institute for AI)와 페...
www.aitimes.kr
출처 : 인공지능신문(http://www.aitimes.kr)
# 참고(kaggle) : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
COVID-19 Open Research Dataset Challenge (CORD-19)
An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House
www.kaggle.com
# 참고 : http://www.rcsb.org/news?year=2020&article=5e3c4bcba5007a04a313edcc(Genomic epidemiology of hCoV-19)
RCSB PDB
As a member of the wwPDB, the RCSB PDB curates and annotates PDB data according to agreed upon standards. The RCSB PDB also provides a variety of tools and resources. Users can perform simple and advanced searches based on annotations relating to sequence,
www.rcsb.org
# Keypoint : 구글은 COVID-19 공개 데이터 세트 프로그램을 통해 무료로 액세스하고 쿼리할 수 있으며, 이제 연구원들은 빅쿼리(BigQuery)에서 표준 SQL 쿼리를 사용하여 머신러닝 모델을 만들고 실행할 수 있는 '빅쿼리 머신러닝(BigQuery ML)'을 사용하여 추가 비용 없이 이 데이터를 사용하여 고급 머신러닝 모델을 학습시킬 수 있다
# 참고 : http://www.aitimes.kr/news/articleView.html?idxno=15861
구글 클라우드 '코로나19 공개 데이터셋'... 연구 위한 자유롭게 액세스 및 빅쿼리 머신러닝 툴 제공 - 인공지능신문
데이터는 항상 공중 보건 비상사태를 연구, 연구 및 퇴치하는 능력에서 결정적인 역할을 하며, 글로벌 위기의 경우, 이 보다 더 중요한 것은 없다.또한 클라우드 규모로 데이터를 분석할 수 있는 데이터 세트 및 ...
www.aitimes.kr