누군가 데이터 마이닝, SSIS, BI, ETL 및 기타 관련 기술을 설명 할 수 있습니까?

StackOverflow https://stackoverflow.com/questions/416566

문제

나는 어제 SSIS (또는 그와 비슷한)를 사용하여 SSIS 패키지로 "Dr. Reginald Williams, PhD"와 같은 이름으로 전달한 상황에 대해 어제 동료와 이야기하고있었습니다. 그리고 일부 가중치 체계를 기반으로 시스템은이 시스템을 토큰 화하고 데이터베이스에 저장하는 방법을 알아낼 수있을만큼 똑똑했습니다. 그는 BI, SSIS, ETL 및 데이터 마이닝과 같은 유행어를 던졌습니다. 나는 정말로 더 많은 정보를 원했지만 어디에서 물어봐야할지조차 몰랐다.

저는 .NET 개발자이며 C#, vb.net, WPF 등에 철저히 정통합니다. 나는 정말로 집중해야한다. 모든 방향이 도움이 될 것입니다.

도움이 되었습니까?

해결책

SSIS == SQL Server 통합 서비스 및 ETL (Extract Transform and Load) 도구이며 SQL7, SQL2K 시대의 데이터 변환 서비스 또는 DTS에 대한 훨씬 우수한 구현입니다. 데이터가 지점에서 B 지점에서 B 지점 (및 C 및 D 등)으로 이동하고 통합과 같은 해당 프로세스를 통해 탈퇴 설계 또는 데이터 클렌징으로 변경되는 워크 플로 프로세스를 표현하기위한 훌륭한 도구입니다.

BI 또는 비즈니스 인텔리전스는 기술 세계의 전체 카테고리의 모니 커이며 지금은 좋은 곳입니다. BI 기술은 매우 가치가 있고 오기가 어렵습니다. 이것이 사실 중 하나는 실험실에서 진정한 BI 사례를 재현하기가 어렵 기 때문에 거의 항상 실제 상황에서 가르치는 것이 이루어지기 때문입니다.

높은 수준에서 BI 프로젝트에는 일반적으로보고의 종말점이 포함됩니다. 종종 개발자로서 우리는 PO의 세부 사항과 같은 거래 보고서 작성에 익숙하지만 BI는 수십 년에 걸쳐 제품 판매 동향을 다루고 수억 개의 레코드를 다루는 매우 광범위한 보고서에 들어갈 수 있습니다. 응용 프로그램을위한 데이터베이스를 설계하는 방식은 이러한 종류의보고에 이상적이지 않으므로 다른 도구와 기술이 발명되어 BI 공간에서 사용됩니다. 이것들은 종종 Olap 큐브라고 불리는 큐브와 같은 것들입니다. OLAP 큐브는 일반적으로 다른 데이터베이스에 지나지 않는 데이터웨어 하우스에서 유래하지만 일반적인 창고에는 둘 이상의 데이터와 종종 수십 개의 다른 응용 프로그램 데이터베이스가 포함되어 있습니다. 인벤토리 앱, 구매 앱, HR 앱 및 기타 전체에 모두 비즈니스의 완전한 그림을 만드는 비트 및 데이터가 포함되어 있으며 BI Architect는 SSI와 같은 것을 사용하여 이러한 모든 시스템에서 데이터를 가져와 마사지합니다. 보고를 위해 다른 종류의 디자인으로 설계된 데이터웨어 하우스에 보관하십시오. 창고에 있으면 분석 서비스를 사용하여 해당 데이터에 대한 큐브를 만들고 해당 데이터에 대한 보고서를 표시하기 위해보고 서비스와 같은 정보를 제공합니다.

편집 : 죄송합니다. 데이터 마이닝을 잊어 버렸습니다.이 용어를 설명하고 개념 또는 프로세스를 설명하는 또 다른 비특이적 용어입니다. 간단한 예에서는 데이터의 패턴을 식별하는 방법 적 접근법입니다. 과거에는 좋은 비즈니스 Analysy는 트렌드에 대한 데이터를 살펴 보지만 최신 데이터베이스를 사용하면 수동으로 빗질하기에는 너무 큰 데이터 세트에 대해 이야기하고 있습니다. 데이터 마이닝은 컴퓨터에 해당 데이터를 빗고 관심있는 패턴을 식별하도록 지시 할 수 있습니다. .

도움이되기를 바랍니다

다른 팁

동료가 한 일은 문자열의 "지능형 구문 분석"으로 더 잘 묘사 될 수 있습니다. 예를 들어 통계 모델을 사용하여 "Dr."가능성을 높이는 등 여러 수준의 정교함에서 수행 할 수 있습니다. 이름이 아닌 인사말입니다. 또는 일반 경례의 간단한 조회 목록 만 사용할 수 있습니다.이 경우에는 정기적 인 절차 코드 일뿐입니다.

SSIS는 SQL Server 통합 서비스가 짧습니다. 기본적으로입니다 DTS 스테로이드; 어떤 사람들은 그것을 좋아하고 어떤 사람들은 그것을 싫어합니다. 당신이 말하는 일을하기 위해 자체적으로 사용하는 것은 까다로울 것입니다. 주로 다양한 소스에서 데이터를 가져 와서 결합하여 변환하고 다른 곳에로드하는 것입니다. 그것은 몇 가지 멋진 일을 할 수 있으며, 그 중 다수는 데이터마다 마신다는 경향이 있지만 궁극적으로 데이터를 한 방향 또는 다른 데이터를 크램링하기위한 생산 도구입니다. 데이터 마이닝 커뮤니티에서 특히 존경받지 않습니다.

데이터 수집 전체 학문 분야는 미래의 답변을 예측하거나 기존 데이터의 패턴을 더 잘 이해하기 위해 일부 (일반적으로 큰) 수량의 데이터를 사용하는 데 중점을 둡니다. 그것은 확실히 들어가기에 좋은 영역이지만, 수학과 알고리즘에 대한 집중적 인 연구 없이는 집어 들고 할 수있는 일은 아닙니다. 주제에 관한 좋은 책은입니다 이 하나.

"Business Intelligence"는 특정 기술보다 유행어에 더 유행어이며 다른 사람들과는 다른 것을 의미 할 수 있습니다. 기본적 으로이 아이디어는 비즈니스 데이터로 멍청한 작업을 덜 수행 할 것을 제안하며 일반적으로 시간이 지남에 따라 추세 분석을 의미하며 종종 OLAP를 사용합니다. 또한 데이터 마이닝 또는 AI 알고리즘이 포함될 수 있지만 엄격한 정의가 없기 때문에 무언가를 팔고 싶은 사람이라면 누구나 "비즈니스 인텔리전스"를 제공 할 것이라고 말할 수 있으며 더 이상 파고 들지 않기를 바랍니다.

SSIS입니다 SQL Server 통합 서비스 많은 데이터웨어 하우징의 프론트 엔드 인 ETL (추출, 변환 및로드)을 수행하는 데 유용합니다.비즈니스 인텔리전스 데이터를 사용하기 쉬운 치수 모델로 통합하는 솔루션. SSIS는 또한 레거시 데이터 또는 다른 리포지토리 또는 파일의 데이터를로드하는 편리한 방법으로 소규모 프로젝트에 유용합니다.

데이터 수집 일반적으로 통합 소스의 데이터를 사용하여 트랜잭션 데이터에서 명백하지 않은 정보를 추론한다는 것을 의미합니다 (데이터에 더 많은 "차원"을 제공하는 여러 소스의 통합을 통해 더 많은 소스를 통합하여 데이터에 더 많은 "차원이 통합됩니다.

BI는 큰 주제이므로 해당 분야에 들어가기를 원하지 않는 한 초점을 맞출 수는 없지만 SSI는 소규모 프로젝트에 유용 할 수 있으며 어떤 경우에도 배울 가치가 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top