Posts [부스트캠프 AI Tech / Day23] Today
Post
Cancel

[부스트캠프 AI Tech / Day23] Today

피어세션 정리

MJ

  • 임의보행 기반 접근법에서 임의보행 중 마주친 모든 정점에 대한 합산이 언제까지 돌리는 건가요?
  • 네거티브 샘플링은 V만 건드리는 것이 맞나요?
    • 1, 2 -> 자연어 처리 쪽의 네거티브 샘플링 같은데 관련이 있을까요?
  • 네거티브 샘플링에서 임의의 u만 뽑아온다면 나머지에 대한 임베딩벡터는 어떻게 구하나요?

펭귄


🤷‍♀️Further Question🤷‍♀️

  • 추천시스템의 성능을 측정하는 metric이 RMSE라는 것은 예상 평점이 높은 상품과 낮은 상품에 동일한 페널티를 부여한다는 것을 뜻합니다. 하지만 실제로 추천시스템에서는 내가 좋아할 것 같은 상품을 추천해주는것, 즉 예상 평점이 높은 상품을 잘 맞추는것이 중요합니다. 이를 고려하여 성능을 측정하기 위해서는 어떻게 해야 할까요?
    • 전체 한 번 학습한 후 높은 평점에 관한 데이터만 뽑아서 다시 학습한다.
    • 여러 모델로 학습해서 나온 결과를 ensemble 할 때 가중치를 준다. (높은 점수에 힘을 실어주자)
    • P, Q를 곱할 때 큰 가중치가 더해지도록 r에 비례하도록 한다.
    • 질문이 정확히 뭘까요..?
      • 동일한 정규화?
      • 높은 평점일 걸 낮게 평가하는거?
  • 추천 시스템의 성능을 향상시키기 위해서는 어떠한 것을 더 고려할 수 있을까요? (해당 문제는 정답이 제공되지 않는 문제입니다. 자유롭게 여러분의 의견을 이야기해보세요.)
    • 평가되지 않은 영화들에 대해서는 메타 데이터를 이용하여 선호도를 대충 추측한다. 사용 전 선호도는 아이템의 메타 데이터(감독, 배우 등)을, 사용 후 선호도는 아이템 자체의 내용을 기반으로 한다.
    • 사용 전 선호도와 uninteresting item은 어떤 관계가 있을까?
      • 사용 전 선호도는 평점을 매긴 item을 기반으로 한다. unrated item을 사용 전 선호도를 기반으로 파악할 수 있다. 이것을 이용해 임계값을 넘지 못하면 다 0점 처리하는 Zero Injection 방법을 사용한다.

과제 진행 상황

  • 과제 현황
    • 과제2

과제 결과물에 대한 정리

-


TIL (Today I Learned)

-


오늘의 한마디

This post is licensed under CC BY 4.0 by the author.