본문 바로가기

전체 글

8주차 회고 1. 강의 복습 내용 Docker(Dock Worker , isolating containers, managing containers, image, registry, pull 등 사용법) , MLOps(밑에 정리함) , Model Serving, Streamlit(만들어 봄) 2. 과제 수행 과정 / 결과물 정리 MLOps 정리 : https://berry-snowstorm-c33.notion.site/Practioners-guide-to-MLOps-A-framework-for-continuous-delivery-and-automation-of-machine-learning-e4a93bf555334e2aad74d42e18b3816b?pvs=4 https://developers.google.com/mach.. 더보기
5,6주차 회고 5주차 회고 : 여러 추천시스템 모델에 대해 배웠다. CF,MF,BANDIT 등 금요일에 역삼 스퀘어에 갔었다. 팀을 처음 만났는데 줌에서만 보던 얼굴들이 반가웠다. 새로운 영감과 자극을 많이 받았다. 추천시스템은 마음을 이해하는 것이라는 생각을 했다. 마음을 이해하려면 뇌를 알아야하고, 뇌를 아는 방법에는 심리학, 뇌과학 등등이 있다. 그 중에 욕구 5단계설을 도입하면 어떨까? 생각했다. 5단계 각각의 비율에 따라 추천의 내용을 달리 하는 것이다. 그리고 메타적으로 모델의 모델을 서빙하는 것은 어떨까 생각했다. (이것은 6주차에 있는 내용이었다.) 왜 하나로 고정해야하나? 사람마다 적합한 모델을 골라주면 안될까?라는 생각을 했다. 6주차 회고: 대회가 시작됨. EDA를 처음 해 봄. 멘토님이 모델을 먼.. 더보기
EDA 가 무엇인가 데이터 사이언스 분야는 심오하다..어떡하지..ㅠㅠ 뉴비는 웁니다. https://data-newbie.tistory.com/842 Paper) 추천 알고리즘들의 Data Split 전략에 대한 논문 리뷰 논문 제목 A Critical Study on Data Leakage in Recommender System Offline Evaluation 추천 시스템에서는 데이터 분리 전략에 대해서 다소 난해한 점이 있는 것 같아. 특정 논문을 리뷰하고자 한다. 결론적으로는 data-newbie.tistory.com https://www.data-science-factory.com/post/exploratory-data-analysis-guideline Exploratory data analysis guidelin.. 더보기
4주차 회고 1. 배운 것 키워드 추천시스템이란 무엇인지? 인기도 기반 추천 연관 분석 - support, confidence, lift - 연관 규칙을 찾은 알고리즘 ( bruteforce, frequent itemset generation strategies (apriori, DHP, FP-Growth) TF-IDF를 활용한 컨텐츠 기반 추천 Collaborative Filtering - user_based, item_based, knn-cf, similiarity measure Model based CF - latent factor model, SVD, Matrix Factorization , Alternative Least Square, BPR item2vec, ANN - CBOW, 딥러닝 - MLP, Aut.. 더보기
Recsys with deep learning literatures - NCF 보호되어 있는 글입니다. 더보기
11/28 깃 강의 이고잉님 깃 강의를 5시간동안 들었다. 졸리다...ㅠ 1. 깃의 본질은 단순하다. 깃은 원리가 가성비라는 명언을 남기셨다. 2. 2000만줄짜리, 30년된, 12000명이 사용하는, 오픈소스를 개발한다고 생각해보자. git이 얼마나 필요한지 느낌이 더 온다. 3. 버전 관리를 안 하면 퇴근시간이 늦어진다. 버그를 찾았다면 어떤 버전부터 생겼는지 알아야 집에 빨리 갈 것이다. ----> 버전 관리의 목적은 디버깅이다. 4. HEAD는 현재 버전을 가리키고, main(master)는 마지막 버전을 가리킨다. 헤드가 가리키는 커밋은 다음 커밋의 부모가 된다. 5. 브랜치는 실험을 위해 존재하고, 병합할 때는 아래와 같이 conflict가 발생할 수 있다. 이때 잘 resolve 하자~ 캡처하면 안되나?밑에 캡.. 더보기
11/27 + kaggle Frequent itemset generation strategies 1.https://en.wikipedia.org/wiki/Apriori_algorithm Apriori algorithm - Wikipedia From Wikipedia, the free encyclopedia Algorithm for frequent item set mining and association rule learning over transactional databases Apriori[1] is an algorithm for frequent item set mining and association rule learning over relational databases. It proc en.wikipedia.org 2. DH.. 더보기
3주차 회고 💃🏻 Liked 딥러닝 배워서 좋았다. 논문도 읽어봐서 좋았다. 🤦🏻‍♂️ Learned deep learning basics - CNN, RNN, generative models, transformer 🤥 Lacked LSTM, RNN, generative models 이해 부족 🚀 Longed for LSTM, RNN, generative models 더 공부하기 더보기