1. Getting & Knowing Data

<aside> 🌴

  1. 데이터 ν–‰κ³Ό μ—΄μ˜ 갯수λ₯Ό 좜λ ₯ν•˜λΌ

  2. μˆ˜μΉ˜ν˜• λ³€μˆ˜λ₯Ό κ°€μ§„ μ»¬λŸΌμ„ 좜λ ₯ν•˜λΌ

    λ²”μ£Όν˜• λ³€μˆ˜λ₯Ό κ°€μ§„ μ»¬λŸΌμ„ 좜λ ₯ν•˜λΌ

  3. 각 컬럼의 결츑치 숫자λ₯Ό νŒŒμ•…ν•˜λΌ

    id          0
    일자          0
    μ‹œλ„λͺ…         0
    읍면동λͺ…        0
    거주인ꡬ        0
    근무인ꡬ        0
    방문인ꡬ        0
    총 μœ λ™μΈκ΅¬      0
    평균 속도       0
    평균 μ†Œμš” μ‹œκ°„    0
    평균 기온       0
    μΌκ°•μˆ˜λŸ‰        0
    평균 풍속       0
    dtype: int64
    
  4. 각 컬럼의 λ°μ΄ν„°μˆ˜, λ°μ΄ν„°νƒ€μž…μ„ ν•œλ²ˆμ— ν™•μΈν•˜λΌ

    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 9621 entries, 0 to 9620
    Data columns (total 13 columns):
     #   Column    Non-Null Count  Dtype  
    ---  ------    --------------  -----  
     0   id        9621 non-null   int64  
     1   일자        9621 non-null   object 
     2   μ‹œλ„λͺ…       9621 non-null   object 
     3   읍면동λͺ…      9621 non-null   object 
     4   거주인ꡬ      9621 non-null   float64
     5   근무인ꡬ      9621 non-null   float64
     6   방문인ꡬ      9621 non-null   float64
     7   총 μœ λ™μΈκ΅¬    9621 non-null   float64
     8   평균 속도     9621 non-null   float64
     9   평균 μ†Œμš” μ‹œκ°„  9621 non-null   float64
     10  평균 기온     9621 non-null   float64
     11  μΌκ°•μˆ˜λŸ‰      9621 non-null   float64
     12  평균 풍속     9621 non-null   float64
    dtypes: float64(9), int64(1), object(3)
    memory usage: 977.3+ KB
    
  5. 각 μˆ˜μΉ˜ν˜• λ³€μˆ˜μ˜ 뢄포(μ‚¬λΆ„μœ„, 평균, ν‘œμ€€νŽΈμ°¨, μ΅œλŒ€ , μ΅œμ†Œ)λ₯Ό ν™•μΈν•˜λΌβŒ

    id 거주인ꡬ 근무인ꡬ 방문인ꡬ 총 μœ λ™μΈκ΅¬ 평균 속도 평균 μ†Œμš” μ‹œκ°„ 평균 기온 μΌκ°•μˆ˜λŸ‰ 평균 풍속
    count 9621.000000 9.621000e+03 9621.000000 9621.000000 9.621000e+03 9621.000000 9621.000000 9621.000000 9621.000000
    mean 27258.000000 3.174315e+05 35471.201510 195889.561802 5.487922e+05 41.109084 37.215873 13.550828 6.972426
    std 2777.487804 2.982079e+05 40381.214775 140706.090325 4.608802e+05 8.758631 12.993786 7.745515 27.617260
    min 22448.000000 9.305552e+03 1407.936000 11538.322000 2.225181e+04 24.333000 12.667000 -9.600000 0.000000
    25% 24853.000000 9.539939e+04 12074.498000 99632.153000 2.216910e+05 34.250000 27.889000 7.600000 0.000000
    50% 27258.000000 2.221105e+05 21960.928000 152805.335000 3.866935e+05 39.640000 34.500000 13.400000 0.000000
    75% 29663.000000 4.106671e+05 40192.032000 236325.109000 6.406918e+05 49.105000 46.176000 19.700000 1.500000
    max 32068.000000 1.364504e+06 263476.965000 723459.209000 2.066484e+06
  6. 평균 속도 컬럼의 4λΆ„μœ„ λ²”μœ„(IQR) 값을 κ΅¬ν•˜μ—¬λΌ

    14.854999999999997

  7. 읍면동λͺ… 컬럼의 μœ μΌκ°’ 개수λ₯Ό 좜λ ₯ν•˜λΌ

  8. 읍면동λͺ… 컬럼의 μœ μΌκ°’μ„ λͺ¨λ‘ 좜λ ₯ν•˜λΌ

    array(['도두동', '외도동', '이도2동', '일도1동', 'λŒ€μ²œλ™', 'μ„œν™λ™', 'ν•œκ²½λ©΄', '솑산동', '쑰천읍',
           '일도2동', 'μ˜μ²œλ™', 'μ˜ˆλž˜λ™', 'λŒ€λ₯œλ™', '삼도1동', 'μ΄ν˜Έλ™', 'κ±΄μž…λ™', '쀑앙동', '삼양동',
           '삼도2동', '이도1동', '남원읍', 'λŒ€μ •μ', '정방동', 'νš¨λˆλ™', '아라동', 'ν•œλ¦Όμ', 'ꡬ쒌읍',
           'μš©λ‹΄1동', 'μ˜€λΌλ™', '화뢁동', '연동', 'ν‘œμ„ λ©΄', '쀑문동', '성산읍', 'μ•ˆλ•λ©΄', 'μ²œμ§€λ™',
           'λ…Έν˜•λ™', '동홍동', 'μš©λ‹΄2동', 'λ΄‰κ°œλ™', '애월읍'], dtype=object)
    
  9. κ²°μΈ‘μΉ˜κ°€ μžˆλŠ” 데이터 행을 λͺ¨λ‘ μ‚­μ œ

  10. μ•žμ—μ„œ λΆ€ν„° 70%의 데이터λ₯Ό μ‚¬μš©ν•΄λΌ

  11. κ²°μΈ‘μΉ˜κ°€ μžˆλŠ” 데이터λ₯Ό 골라라