λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
- ν”„λ‘œκ·Έλž˜λ° μ–Έμ–΄ πŸ’»/R 빅데이터 뢄석 기초

빅데이터뢄석싀무 2κΈ‰ 취득 ν›„κΈ° - ν•œκ΅­μ •λ³΄μΈμž¬κ°œλ°œμ›

by beebon 2020. 4. 26.
728x90

1. 문과인 λ‚΄κ°€ μ™œ 빅데이터λ₯Ό λ°°μš°λŠ” κ°€?

λ‚˜λŠ” 행정학을 μ „κ³΅ν•œ μ‚¬νšŒν•™λ„λ‹€. 내겐 ν•™λΆ€μ‹œμ ˆ 컴퓨터λ₯Ό 만져볼 일이 μ—†μ—ˆλ‹€. 뢀전곡, 닀전곡도 ν•˜μ§€ μ•Šμ•˜κ³  ν–‰μ •κ³„λŸ‰μˆ˜μ—…μ„ λ“€μ„λ•Œ excel을 μ΄μš©ν•΄μ„œ κ°„λ‹¨ν•œ 데이터λ₯Ό 톡해 톡계λ₯Ό λ‚΄λ³Έ κ²½ν—˜λ§Œ 두 번 μžˆλ‹€. 

그런데 4학년이 λ˜λ©΄μ„œ, λ‚˜μ˜ μ„±ν–₯에 λŒ€ν•΄ 깊게 λΆ„μ„ν•˜κΈ° μ‹œμž‘ν•˜λ©΄μ„œ IT에 ν˜ΈκΈ°μ‹¬μ„ κ°–κΈ° μ‹œμž‘ν–ˆλ‹€. λ‚œ 늘 창의적이고, 탐ꡬ적이고, 주도적 μ„±ν–₯으둜 ν•™λΆ€μƒλ•Œ κ³Όμ œμ™€ νŒ€ν”„λ‘œμ νŠΈ, μ‹œν—˜μ— μž„ν–ˆλ‹€. κ·Έλž˜μ„œ μ •λΆ€μ‚°ν•˜ 연ꡬ기관에 μ·¨μ—…ν•΄μ„œ μ—°κ΅¬ν•˜λŠ” 일이 λ‚΄κ²Œ λ§žμ„ 것 κ°™λ‹€κ³  μƒκ°ν–ˆλ‹€. 그러기 μœ„ν•΄μ„  λŒ€ν•™μ›μ„ μž…ν•™ν•˜μ—¬ ν–‰μ •ν•™μ˜ ν•œ 뢄야에 λŒ€ν•΄ μ’€ 더 깊게 νŒŒκ³ λ“€μ–΄κ°€μ•Ό ν–ˆλ‹€. ν•˜μ§€λ§Œ, ν˜„μ‹€μ μœΌλ‘œ λ‚˜μ™€ λ§žμ§€ μ•Šμ•˜λ‹€. 일단 μ‚¬νšŒμ—μ„œ λͺΈμ„ λΆ€λ”ͺν˜€κ°€λ©° λΆ€λͺ¨λ‹˜μ—κ²Œ μ†λ²Œλ¦¬μ§€ μ•Šκ³ , λ‚΄κ°€ 번 돈으둜 μ•Όκ°„ λŒ€ν•™μ›μ„ λ‹€λ‹ˆλ“ μ§€ ν•  거라고 마음 λ¨Ήμ—ˆλ‹€.

 

μ§€κΈˆ λ‹Ήμž₯ 일자리λ₯Ό κ΅¬ν•œλ‹€λ©΄, κ²½μ˜μ§€μ›μ˜ 인사직무가 λ‚˜μ™€ λ§žλ‹€λŠ” 생각이 λ“€μ—ˆλ‹€. μ •ν™•νžˆλŠ” μΈμ μžμ›κ°œλ°œ HRD 업무λ₯Ό ν•˜κ³  μ‹Άμ—ˆλ‹€. μž₯기적으둜 μΈμ μžμ›μ˜ μž μž¬μ„±μ„ ν‚€μ›Œμ£ΌλŠ” μ»¨μ„€νŒ…, 강연을 ν•˜κ³  μ‹Άμ€κ²Œ κΏˆμ΄λ‹€. λ‚˜λŠ” λ‹Ήμž₯ μ·¨μ—…ν•˜κΈ° 전에 μ•½κ°„μ˜ 경쟁λ ₯을 μŒ“κ³  λ“€μ–΄κ°€μ•Ό κ² λ‹€κ³  μƒκ°ν–ˆλ‹€. 아직 쑸업은 μ•ˆ ν–ˆμœΌλ‹ˆ λ˜λŠ” 데 κΉŒμ§€ ν•œλ²ˆ λŠ₯λ ₯을 λŒμ–΄μ˜¬λ €λ³΄κ³  μ‹Άμ—ˆλ‹€. 

2. 빅데이터λ₯Ό 배우게 된 기회 

μš”μƒˆ ν•™κ΅μ—μ„œλŠ” 문과생을 λŒ€μƒμœΌλ‘œ ν•œ 빅데이터 μˆ˜μ—…μ„ κ½€ 많이 μ§„ν–‰ν•˜κ³  μžˆλ‹€. μ •λΆ€μ—μ„œ 빅데이터, 4μ°¨μ‚°μ—…ν˜λͺ…을 μ£Όμš” ν‚€μ›Œλ“œλ‘œ λ‚΄μ„Έμš°λ©΄μ„œ κ·Έ μ€‘μš”μ„±μ΄ 컀진 것이닀. 사싀 λ§žλ‹€. μ œμ‘°μ—…μ΄ ν˜Έν™©μ„ λˆ„λ¦¬λ˜ μ‹œλŒ€λŠ” κ°€κ³ , ν˜„μž¬λŠ” μ„œλΉ„μŠ€μ—…μ΄ μš°μ„Έκ°€ λ˜μ—ˆλ‹€. λ‹Ήμ‹œμ˜ λ³€ν™”ν•˜λŠ” μ‹œλŒ€μ— μ μ‘ν•˜μ§€ λͺ»ν•˜λ©΄ μ•ˆ κ·Έλž˜λ„ νž˜λ“  μ‚Ά, 퍽퍽해 질 κ±°λ‹€. 

μ΄ˆλ“±ν•™μƒμ΄ 코딩을 의무ꡐ윑으둜 λ°›λŠ” 이 μ‹œλŒ€, λ‚˜λŠ” μ‹œκ°„λ„ μžˆκ² λ‹€ 'R을 ν™œμš©ν•œ 빅데이터 뢄석'μ΄λΌλŠ” μˆ˜μ—…μ„ λ“€μ–΄λ³΄κΈ°λ‘œ ν–ˆλ‹€.  결과적으둜 λ‚˜μ™€λŠ” 잘 λ§žμ•˜λ‹€. 

3.  '빅데이터뢄석싀무 2κΈ‰'을 μ·¨λ“ν•˜λ‹€.

2μ£Όκ°„ λŒ€λ‹€μˆ˜μ˜ μ†Œν”„νŠΈμ›¨μ–΄ν•™κ³Ό, 컴퓨터곡학과생과 μ†Œμˆ˜μ˜ 문과생(κ΅­μ–΄κ΅­λ¬Έ, ν–‰μ •)이 ν†΅κ³„ν”„λ‘œκ·Έλž¨μΈ 'R'을 ν™œμš©ν•œ 빅데이터 뢄석 μˆ˜μ—…μ„ λ“€μ—ˆλ‹€. μˆ˜μ—…μ΄ λλ‚˜κ³  ν•œκ΅­μ •λ³΄μΈμž¬κ°œλ°œμ›μ—μ„œ μ§„ν–‰ν•œ '빅데이터 뢄석싀무 2κΈ‰' μžκ²©μ¦λ„ μ·¨λ“ν•˜κ²Œ λ˜μ—ˆλ‹€. λ―Όκ°„μ—μ„œ μ‹€μ‹œν•˜λŠ” μ‹œν—˜μ΄λΌ λ‚œμ΄λ„κ°€ κ·Έλ ‡κ²Œ 어렡지 μ•Šμ•˜λ‹€. ν•˜μ§€λ§Œ λ‹Ήμ‹œ μ†Œν”„νŠΈμ›¨μ–΄ν•™λ„μƒμ΄ 반이 λ„˜λŠ” μˆ˜μ—…μ—μ„œ, 뒀쳐지더라도 ν¬κΈ°ν•˜μ§€ μ•Šκ³  λ”°λΌκ°”λ˜ 게 슀슀둜 λΏŒλ“―ν•˜λ‹€.  

λ‚΄κ°€ ν•  수 있으면, λ‹€λ₯Έ λˆ„κ΅°κ°€λ„ ν•  수 μžˆλ‹€. 내겐 κ½€ μž¬λ°Œμ—ˆλ‹€. λ­”κ°€ 그림을 κ·Έλ €λ‚˜κ°€λŠ” κ³Όμ • κ°™κΈ°λ„ν•˜κ³ . 탑을 μŒ“λŠ” 것 같기도. 숫자λ₯Ό 이리저리 μ›€μ§μ΄λ©΄μ„œ, μœ μ˜λ―Έν•œ 결과값을 λ„μΆœν•΄ λ‚΄λŠ” 것이 κ½€ ν₯λ―Έλ‘œμ› λ‹€. λ‚˜μ™€ 같은 ν–‰μ •ν•™λ„λŠ” μ‚¬νšŒν˜„μƒμ„ λΆ„μ„ν•΄μ„œ μ–΄λ–€ 인과관계가 μžˆλŠ”μ§€ μ•Œμ•„λ‚΄λ €κ³  ν•œλ‹€. 그런데 λΉ…λ°μ΄ν„°λŠ” 원인과 κ²°κ³Όκ°„μ˜ 인과 관계λ₯Ό μ‚΄νŽ΄λ³΄λŠ” 것 λ³΄λ‹€λŠ”, 'A사건이 많이 μΌμ–΄λ‚˜λ©΄ , BλΌλŠ” κ²°κ³Όκ°€ 많이 λ‚˜νƒ€λ‚˜λ”λΌ' λ₯Ό 톡해 κ·Έ μ•ˆμ˜ κ²°κ³Όλ₯Ό λ„μΆœν•΄λ‚΄λŠ” 논리λ₯Ό μ°ΎλŠ” 것이 μ•„λ‹Œ '그럼 Aλ₯Ό 늘리자'λΌλŠ” μ‹μ˜ 방식을 μΆ”κ΅¬ν•œλ‹€. 빅데이터이기 λ•Œλ¬Έμ— κ°€λŠ₯ν•œ 것이닀. μˆ˜λ§Žμ€ 데이터λ₯Ό 톡해 κ²°κ³Όκ°€ μž…μ¦λœ 것이기 λ•Œλ¬Έμ—. 

가끔 μ‚¬λžŒλ“€μ€ μžκΈ°κ°€ 무엇을 μ›ν•˜κ³  무슨 생각을 ν•˜κ³  μ‚¬λŠ” 지 잘 λͺ¨λ₯΄λŠ” λ“― ν•˜λ‹€. ν•˜μ§€λ§Œ 넀이버, κ΅¬κΈ€μ—μ„œ κ²€μƒ‰ν•œ λ‚΄μš©μ„ μ‚΄νŽ΄λ³΄κΈ°λ§Œ 해도 μš”μƒˆ 무슨 생각을 ν•˜κ³  μ‚¬λŠ”μ§€ λŒ€λž΅ μ•Œ 수 μžˆλ‹€. λ°©λŒ€ν•œ κ²€μƒ‰μ–΄λŠ” 빅데이터가 λ˜μ–΄μ„œ μ„œλΉ„μŠ€μ—…, ITμ—…, λ§ˆμΌ€νŒ…μ— μ‚¬μš©λ˜λŠ” 것이닀.  μ†ŒλΉ„μžμ˜ needs에 λ§žμΆ°μ„œ μ‹œμž₯은 발빠λ₯΄κ²Œ 움직인닀. 그리고 μ‹œμž₯은 κ·Έ 속도에 맞좰 λ›Έ 수 μžˆλŠ” λ…Έλ™μžλ₯Ό μ›ν•œλ‹€.  

이런 쒅합적인 μ΄μœ λ“€λ‘œ λ‚˜λŠ” 코딩을 배우기 μ‹œμž‘ν–ˆλ‹€. μƒˆλ‘œμš΄ 것을 배울 수 μžˆλ‹€λŠ”κ²Œ μ„€λ Œλ‹€. μ•žμœΌλ‘œ λ‚΄κ°€ λ°°μ›Œκ°€λŠ” κ°€μž₯ 기초적인 코딩을 κ³΅μœ ν•΄λ³΄λ €κ³  ν•œλ‹€. 

 

λ°˜μ‘ν˜•

λŒ“κΈ€