협업 필터링 : 각 사용자의 제품에 대한 암시 적 점수를 결정하는 방법?

StackOverflow https://stackoverflow.com/questions/1243726

문제

성공한 제품을 추천하기 위해 알고리즘을 구현 한 후이 알고리즘의 초기 입력 데이터를 계산하는 방법을 찾고 있습니다.

내 목표는 사용자가 어떤 종류의 기록을 가지고있는 각 제품에 대한 점수를 계산하는 것입니다.

현재 수집중인 데이터 :

  • 사용자 주문 기록
  • 익명 및 등록 된 사용자 모두를위한 제품 페이지 뷰 기록

이 모든 데이터는 타임 스탬프되었습니다.

내가 찾고있는 것

제가 제안하려는 몇 가지 사항이 있으며, 이상적 으로이 질문은 단일 '올바른'대답을 목표로하기보다는 토론을 위해 더 많이 대우해야합니다.

  • 제품에 대한 관심을 직접 암시 할 수있는 사용자를 위해 수집 할 수있는 추가 데이터
  • 이 데이터를 각 제품의 점수로 전환하기위한 알고리즘/방정식

내가 찾고 있지 않은 것

이 질문이 잘못된 종류의 답변으로 탈선하는 것을 피하기 위해, 여기에 각 사용자에 대해이 데이터를 가지고 일단 내가하고있는 일이 있습니다.

  • 거리 점수에 대한 Pearsons 계수를 사용하여 K-Means 클러스터링 알고리즘을 사용하여 여러 사용자 클러스터 (현재 21) 생성
  • 각 사용자에 대해 클러스터 내에서 가장 유사한 사용자를 찾고, 임의의 깊이를 반복하여 유사한 사용자의 그래프를 계산합니다.
  • 사용자 그래프 내 다른 사용자의 선호도를 기반으로 각 제품의 점수 계산
  • 점수를 정렬하여 권장 사항 목록을 반환합니다

기본적으로 나는 일단 내가해야 할 일에 대한 아이디어를 찾고 있지 않습니다. 가지다 입력 데이터 (나중에 도움이 필요할 수 있지만이 질문의 요점은 아닙니다),이 입력 데이터를 처음에 생성하는 방법에 대한 아이디어는 처음에 있습니다.

도움이 되었습니까?

해결책

다음은 응답의 건초 제작자입니다.

  • 제품을 보는 시간
  • 제품에 대한 의견에 대한 의미 론적 해석
  • 제품, 브랜드 또는 제품 카테고리에 대한 토론 페이지를 만들고 의미 적으로 의견을 해석합니다.
  • 제품 페이지를 공유 한 경우 (이메일, del.icio.us 등)
  • 브라우저 (모바일은 랩톱에 대한 페이지에서 시간을 덜 보내면서 관심이 큰 관심을 나타냅니다)와 연결 속도 (페이지에 소요되는 시간에 영향을 미칩니다).
  • Facebook 프로필 유사성
  • 히트 맵 데이터 (예 : LA KISSMETRICS)

어떤 종류의 제품을 판매하고 있습니까? 그것은 우리가 더 잘 대답하는 데 도움이 될 수 있습니다. (이것은 오래된 질문이기 때문에 @andrew ingram과 같은 질문을 가지고 있으며 검색을 통해이 스레드를 찾은 다른 사람을 다루고 있습니다.)

다른 팁

  1. Netflix가 사용자가 별을 할당 할 수있는 방식 인 사용자가 선호도를 명시 적으로 명시 할 수 있도록 허용 할 수 있습니다.
  2. 구매 기록이 있다고 말하면 구매 한 모든 물건에 대해 긍정적 인 숫자 값을 할당 할 수 있습니다. 그들이 사지 않은 물건에 대해 0을 할당하십시오
  3. 당신은 그들이 구입 한 물건에 대해 일종의 가중 가치를 행할 수 있으며, 인기있는 것에 맞게 조정됩니다. (거의 모든 사람이 제품을 구입 한 경우, 그들이 구입 한 사람에 대해 많이 말하지는 않습니다) "기간 주파수 - 반대 방향 문서 주파수"
  4. 또한 사용자가 보았지만 구매하지 않은 품목에 대해 더 적은 숫자 값을 할당 할 수도 있습니다.
라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top