문제

모바일 장치에서 태그 클라우드를 구현하고 있습니다. 데이터 모델 등에 대한 세부 사항은 여기에서 특히 중요하지 않습니다. 내 질문은 태그의 스케일링에 관한 것입니다.

태그 주파수를 글꼴 크기에 매핑하는 '가장 좋은'표현식은 무엇입니까?

나는 보았다 이 게시물 선형 및 로그 스케일링에 대해 논의합니다 이 답변 영감을위한 다항식 접근의 Adrian Kuhn 스케치에서. 그러나 나는이 문제에 대해 훨씬 더 많은 탐구를하는 웹 인터 웹의 일부 장소를 기억하는 것 같습니다.

나는 또한 일부를 찾았다 "모범 사례"블로그에서는 모범 사례에 대한 프로비던스가 확실하지 않지만 주파수 스케일링에 대해서는 언급하지 않습니다.

태그 스케일링에 대한 대안은 무엇이며 선호하는/표준 방법은 무엇입니까? 또한 최소 글꼴 크기, 최대 태그 수, 색상 등을 고려하고 있습니다.

편집 : 토론에 따라 이 질문, 나는 글꼴 크기 변형이있는 "표준"Tagcloud에 관심이 있습니다.

도움이 되었습니까?

해결책

작년에 작은 태그 클라우드 프로젝트에서 일했는데

β = (int) (((maxθ - minθ) x ω) + minθ + 0.5)
여기서 ω는 일부 메트릭 (경우 글꼴 주파수)에 따라 이전에 계산 된 가중치 인 경우, Minθ 및 Maxθ는 하한 및 상한이며 β는 최종 값입니다. 이것은 시각적 특성 (글꼴 크기, 색상, 지원되는 경우 무게 등)에 적용될 수 있습니다.

선형 및 로그 스케일링이 데이터 세트 분포에 의존하는 경향이 있음을 발견했습니다. 눈에 띄는 특이 치가있는 데이터 세트에서 TANH는 결과 값을 '스무딩'하는 데 유용하다는 것을 알았습니다.

다른 팁

훌륭한 토론이 있습니다 이 PDF, 표시되는 태그에서 스케일링, 클러스터링 및 잘린 자리에 대해 설명합니다.

내가 찾은 해결책은 다음과 같습니다

font_size = (max_font_size - min_font_size) * (Math.sin(1.5*(X)) + minsize

여기서 X는 글꼴 크기에 매핑하려는 정규화 된 값입니다.

X = (this_value-min_value)/(max_value-min_value)

이것은 높은 특이 치의 영향을 최소화하는 것과 같은 범위의 3 분위수의 크기 차이를 증가시킵니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top