Python에서 TimesSeries 모듈을 사용하여 1000 개의 다른 데이터 시리즈를 유지하는 방법은 무엇입니까?

https://stackoverflow.com/questions/1894981

19-09-2019
|

문제

나는 각각 1500 개의 일일 데이터 포인트를 저장하는 1000 개의 다른 금융 시장 데이터 시리즈를 보유 할 대규모 Timeseries 객체를 만들고 싶습니다. 나는 TimeSeries 모듈을 처음 접했고 내가 어떻게 가장 잘 진행 될지에 대해 약간 혼란스러워합니다. 그래서 몇 가지 기본 질문 :

1) 1000x1500의 거대한 Numpy 배열을 사용하고 시계열 생성자 기능 time_series ()에이를 간단히 공급해야합니까?

2) 이렇게하면 각 시리즈가 이름으로 어떻게 색인화됩니까 (예 : "S & P500"또는 "Gold")? 날짜별로 배열에 액세스 할 수 있다는 것을 알고 있지만 큰 배열에 열 번호와 일련의 이름을 연결하려면 별도의 데이터 구조가 있어야합니까?

3) 또는 문서에 주어진 예제에 따라 구조화 된 데이터 유형을 사용해야합니다 (http://pytseries.sourceforge.net/core.timeseries.html)? 그렇다면 한 번에 Time_Series () 생성자에게 공급하기 위해 거대한 NUMPTY 구조를 만들고 싶지 않기 때문에 시리즈를 하나씩 타임 서리에 추가하려면 어떻게해야합니까?

금융 시장 및 시간 세리에 모듈에 대한 좋은 사례를 어디서 얻을 수 있는지에 대한 조언도 일반적으로 감사 할 것입니다.

감사.

해결책

이에 대한 도움을 받으려면 살펴보십시오 Quantlib 이는 금융 업무에 유용한 라이브러리이며 활발한 사용자 메일 링리스트가 있습니다.

게다가, 이 책 리뷰를 읽으십시오 파이썬의 재무 모델링이라는 제목의 책.

다른 팁

1) 한 번은 링크 된 문서의 작은 세트 (~ 10k)에 대한 PageRank 알고리즘을 구현 했으므로 계산 중에 10kx10k 행렬을 처리해야했습니다. numpy 배열 구현은 - 내가 기억하는 것처럼 - 멍청하게 빠른.

2) 시리즈 이름과 같은 메타 데이터 저장 외부 이름은 그다지 아프지 않습니다 ..

3) 나는 scikits.timeseries와 함께 일하지 않았지만 확실히 조사 할 것입니다. 내가 볼 수있는 한, 프로젝트는 Numpy와 같은 Scipy 궤도 주위에 산다 ..

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow