데이터 사이언스 남은 과제들 - 불편한 진실
- 데이터는 절대 깨끗하지 않다
- 당신은 분석의 대부분의 시간을 전처리 단계에서 보내게 될 것이다
- 95% 일에는 딥러닝(Deep Learning)을 필요로 하지 않는다
- 실제 분석의 90%는 일반화 선형모형(GLM)으로 해결된다
- 빅데이터는 단지 도구일 뿐이다
- 당신은 베이지안 접근을 포용해야 한다
- 사용자 입장에서는 네가 어떤 방법을 사용했는가는 중요하지 않다
- 학계와 산업계는 서로 다른 세계이다
- 프리젠테이션이 핵심이다: 파워포인트 마스터가 되라
- 모든 모델은 틀렸다, 하지만 몇몇은 유용하다
- 완전 자동화된 데이터 사이언스같은 것은 없다. 인간이 개입되어야 할 부분이 있다
데이터 사이언스 남은 과제들 - 심슨의 역설
'Data Science ' 카테고리의 다른 글
한국 영화 박스오피스 TOP 랭킹(가장 반응이 좋았던 순위-스파이더맨 트랜스포머 식객 외) 2007년 -2008년 (0) | 2020.10.01 |
---|---|
심슨의 역설 Simpson's paradox (0) | 2020.05.27 |
[Python] 시청률 랭킹 Top10 2011-2020 (0) | 2020.02.18 |
[차트랭킹]역대 공중파 티비 시청률 순위 2011 - 2020 (0) | 2020.02.17 |
[BigData]Earthsquake on Map. 지진 빅데이터 지도에 표시하기 (0) | 2020.01.16 |