78. 한국에서 범죄 데이터 구하기
• 경찰청에서는 범죄 유형별, 행정구역별, 월별 합산된(aggregated) 자료만 공개
• 자세한 정보는 사건 번호와 당사자 이름을 알아야 대법원에서 조회 가능
• 범죄 유형, 대략적인 주소와 시간을 알려주는게 그렇게 어려운가…
79. Potential Workaround
• 신문 기사를 수집
• 인공지능 자연어 분석
• 사건 발생 날짜와 위치, 사건의 개요 알아내기
• 를 한다면 몇년이 걸릴수도 있겠지…
• 자연계의 멱함수(power law) 법칙을 생각해보면 언론에 보도되는 사건
보다는 보도되지 않는 사건이 훨씬 더 많을 듯
105. 한자-한글 변환 라이브러리
• 캘리포니아주에 거주하시는 Will Monroe
• 스탠포드 대학 박사 과정
• 자연어 처리
Natural language processing, computational pragmatics, natural language
grounding, semantic parsing, and multilingual applications
• 한국인이 아니었잖아!?
근데 나보다 한국어에 대해 더 많이 아는 것 같아…
106. 코드를 공개하는 이유는 무엇인가요?
역설적으로 코드를 공개하는 것이 나의 이득을 극대화 하는 방법
107. 코드의 수명
• 한번 작성해놓은 코드는 변하지 않지만
• 내 코드가 실행되는 환경은 다른 사람들의 수많은 코드 위에 쌓아올린 것
• 코드가 실행되는 주변환경은 끊임없이 변화
108. 코드의 수명
• 주변 환경에 하위호환성(backward-compatibility)을 깨는 변화가 생겼
을 때, 내 코드의 문제점을 발견하기 위해서는 누군가가 그것을 계속 사
용하고 있어야 함
124. 실천하고 있는 것
• 무슨 일이 있어도 체크무늬 셔츠는 입지 않는다
• 15년째 꾸준한 운동
• 비기술직군의 사람들과도 꾸준히 소통하기
• 여행지의 지역 주민들과 대화해보기
• 안경을 벗기 위해선 뭘 해야 할까?
트레이드마크 하나 정도는 남겨놔도 괜찮지 않을까?