-tf.reduce_mean(tf.log(tf.reduce_sum(prediction * y, axis=1)))
prediction * y의 곱 ⇒ 출력이 얼마나 겹치는 지를 element-wise하게 비교
reduce_sum ⇒ 겹치면 겹칠수록 sum의 값이 올라감
log ⇒ It heavily penalizes predications that are wrong.
reduce_mean ⇒ mean of every elements to represent score