BigQuery의 백분위 수로 행의 ID를 얻는 가장 좋은 방법은 무엇입니까?

StackOverflow https://stackoverflow.com//questions/22060430

  •  23-12-2019
  •  | 
  •  

문제

나는 BigQuery의 Wikipedia의 공개 데이터 세트로 일하고 있습니다.나는 75 번째, 80 번째, 85, 90 번째 백분위 수의 성격 수를 갖는 Wikipedia 기사의 ID를 찾고 왔습니다.

QUANTILES를 반환하는 QUINESILES 함수를 알고 있지만 모든 ID를 어떻게 검색 할 수 있습니까?

도움이 되었습니까?

해결책

어떨까요?

SELECT a.id 
FROM [publicdata:samples.wikipedia] a
CROSS JOIN (
 SELECT NTH(75, QUANTILES(num_characters, 100)) amin, NTH(76, QUANTILES(num_characters, 100)) amax
 FROM [publicdata:samples.wikipedia]) b
WHERE a.num_characters > b.amin AND a.num_characters < b.amax;
.

76 번째, 86 번째 등의 ID가 무엇을하고 있습니까?정확한 요구에 따라 이전 쿼리를 적용 할 수 있어야합니다.

(더 효율성을 위해 Quantiles 쿼리 결과를 암시하는 대신 새 테이블에 Quantiles 쿼리 결과를 추출해야합니다. 쿼리가 빠르고 저렴합니다)

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top