• LightGBM 고효율 그래디언트 부스팅 결정 트리

    Guolin Ke, Qi Meng, Thomas Finley, Taifeng Wang, Wei Chen, Weidong Ma, Qiwei Ye, Tie-Yan Liu의 LightGBM: A Highly Efficient Gradient Boosting Decision Tree을 번역했습니다. 초록 그래디언트 부스팅 결정 트리(GBDT)는 널리 사용하는 기계 학습 알고리즘이며 XGBoost와 pGBRT 같이 효율적으로 구현해놓은 것이 몇 가지 있다. 해당 구현은 엔지니어링의 많은 요소를 최적화시켰지만...


  • 아파치 에어플로우로 작업흐름 개발해보기

    Michal Karzynski의 Get Started Developing Workflows with Apache Airflow을 번역했습니다. Apache Airflow는 복잡한 계산을 요하는 작업흐름과 데이터 처리 파이프라인을 조율하기 위해 만든 오픈소스 도구이다. 길이가 긴 스크립트 실행을 cron으로 돌리거나 빅데이터 처리 배치 작업을 정기적으로 수행하려고 할 때 Airflow가 도움이 될 수 있다. 이 포스트는 Airflow를 이용하여 파이프라인을 구현해보려고 시도하는...


  • 광고 클릭 예측을 통해 페이스북이 얻은 실용적인 교훈

    Xinran He, Junfeng Pan, Ou Jin, Tianbing Xu, Bo Liu, Tao Xu, Yanxin Shi, Antoine Atallah, Ralf Herbrich, Stuart Bowers, Joaquin Quiñonero Candela의 Practical Lessons from Predicting Clicks on Ads at Facebook을 번역했습니다. 초록   온라인 광고에서 광고주는 광고 클릭 같이 측정가능한 사용자 응답에 대해 입찰하며 대금을 지불한다. 그러므로 클릭...


  • 추천시스템을 위한 와이드 앤 딥 러닝

    Heng-Tze Cheng, Levent Koc, Jeremiah Harmsen, Tal Shaked, Tushar Chandra,Hrishi Aradhye, Glen Anderson, Greg Corrado, Wei Chai, Mustafa Ispir, Rohan Anil,Zakaria Haque, Lichan Hong, Vihan Jain, Xiaobing Liu, Hemal Shah의 Wide & Deep Learning for Recommender Systems을 번역했습니다. 초록 입력값이 희소한 대규모 회귀 분석과 분류 문제에 비선형 변수 변환을 적용한...


  • 에어비앤비에서 기계학습 이용해서 숙소 가치를 예측하는 방법

    Robert Chang의 Using Machine Learning to Predict Value of Homes on Airbnb을 번역했습니다. 서론 Airbnb 서비스에서 데이터 제품은 늘 중요한 부분을 차지한다. 그러나 데이터 제품을 만드는데 막대한 비용이 들어간다는 사실을 점차 깨닫게 되었다. 예를 들어 개인화 검색 순위로 게스트는 숙소를 더 쉽게 찾을 수 있고 스마트 가격 정책으로 호스트는 수요와...