협업 필터링 : 각 사용자의 제품에 대한 암시 적 점수를 결정하는 방법?

문제

성공한 제품을 추천하기 위해 알고리즘을 구현 한 후이 알고리즘의 초기 입력 데이터를 계산하는 방법을 찾고 있습니다.

내 목표는 사용자가 어떤 종류의 기록을 가지고있는 각 제품에 대한 점수를 계산하는 것입니다.

현재 수집중인 데이터 :

이 모든 데이터는 타임 스탬프되었습니다.

제가 제안하려는 몇 가지 사항이 있으며, 이상적 으로이 질문은 단일 '올바른'대답을 목표로하기보다는 토론을 위해 더 많이 대우해야합니다.

이 질문이 잘못된 종류의 답변으로 탈선하는 것을 피하기 위해, 여기에 각 사용자에 대해이 데이터를 가지고 일단 내가하고있는 일이 있습니다.

기본적으로 나는 일단 내가해야 할 일에 대한 아이디어를 찾고 있지 않습니다. 가지다 입력 데이터 (나중에 도움이 필요할 수 있지만이 질문의 요점은 아닙니다),이 입력 데이터를 처음에 생성하는 방법에 대한 아이디어는 처음에 있습니다.

해결책

다음은 응답의 건초 제작자입니다.

제품을 보는 시간
제품에 대한 의견에 대한 의미 론적 해석
제품, 브랜드 또는 제품 카테고리에 대한 토론 페이지를 만들고 의미 적으로 의견을 해석합니다.
제품 페이지를 공유 한 경우 (이메일, del.icio.us 등)
브라우저 (모바일은 랩톱에 대한 페이지에서 시간을 덜 보내면서 관심이 큰 관심을 나타냅니다)와 연결 속도 (페이지에 소요되는 시간에 영향을 미칩니다).
Facebook 프로필 유사성
히트 맵 데이터 (예 : LA KISSMETRICS)

어떤 종류의 제품을 판매하고 있습니까? 그것은 우리가 더 잘 대답하는 데 도움이 될 수 있습니다. (이것은 오래된 질문이기 때문에 @andrew ingram과 같은 질문을 가지고 있으며 검색을 통해이 스레드를 찾은 다른 사람을 다루고 있습니다.)

다른 팁

Netflix가 사용자가 별을 할당 할 수있는 방식 인 사용자가 선호도를 명시 적으로 명시 할 수 있도록 허용 할 수 있습니다.
구매 기록이 있다고 말하면 구매 한 모든 물건에 대해 긍정적 인 숫자 값을 할당 할 수 있습니다. 그들이 사지 않은 물건에 대해 0을 할당하십시오
당신은 그들이 구입 한 물건에 대해 일종의 가중 가치를 행할 수 있으며, 인기있는 것에 맞게 조정됩니다. (거의 모든 사람이 제품을 구입 한 경우, 그들이 구입 한 사람에 대해 많이 말하지는 않습니다) "기간 주파수 - 반대 방향 문서 주파수"
또한 사용자가 보았지만 구매하지 않은 품목에 대해 더 적은 숫자 값을 할당 할 수도 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow