빅 데이터 : 혁명이 어떻게 전개 될지

2012 년이 대대적 인 데이터 과대 광고, 관심 및 파일럿 프로젝트의 해가되면 2013 년에는 생산 배치, 초기 투자 수익률 및 약간의 혼란이 초래됩니다. 2014 년에는 대용량 데이터 프로젝트 및 시스템이 보편화 될 것입니다.

CIO : 빅 데이터 프로젝트를 통해 CIO는 마침내 “우리는 일렬로 맞습니까?” CFO :이 모든 정보 흐름은 비용을 통제하고 수익을 극대화하는 방법으로 원인을 뒷받침하는 CFO에게는 유토피아입니다. CMO (Chief Marketing Officer) : 2012 년에 CMO는 IT 지출 공을 사용하게되었습니다. 그 초점은시기 상조 일 수 있습니다. 왜? CMO는 주로 자신의 프로젝트에 대한 외부 데이터 및 신호에 의존합니다. 소비자가 직면하지 않는 기업은 아직 존재하지 않습니다. CMO에는 예산이 있습니다. 또한 빅 데이터 엔지니어는 마케팅에 영향을 줄 수 있습니까? COO (Chief Operating Officer), 조달 담당 직원 : 빅 데이터를 사용하면 재고, 공급 및 제조 프로세스를 처음부터 끝까지 추적 할 수 있습니다. 분석이 끝나면 효율성은 향상 될 것입니다.; 데이터 과학자 :이 사람들은 점차 C 수준의 자료로 간주됩니다. 경력 현명한, 데이터 wonks 자신의 티켓을 작성할 수 있습니다.

올해 큰 데이터는 클라우드 컴퓨팅과 비슷한 기술 용어가되었습니다. 이 용어는 많은 의미를 지니고 있지만 너무 많이 사용되면서 정의가 사라집니다. 그런 정의는 일반적으로 속도 (데이터가 빠르게 움직이고 있음), 볼륨 (너무 많음) 및 다양성 (구조화되지 않은 구조화 된 정보)을 중심으로 회전합니다.

큰 데이터가 마약 중독에 부합합니까? 예. 나에게 커다란 데이터는 기술과 비즈니스의 조화를 의미합니다. 즉, CIO가 끊임없이 추구하는 성배 (Sty Grail)는 아무 생각이 들지 않습니다. 본질적으로 거대한 데이터 프로젝트는 수익, 위험 및 이익에 관한 것입니다. 즉, IT와 비즈니스는 서로 도움을 줄 수는 없지만 서로 조화를 이룰 수는 없습니다.

대용량 데이터 : 가능성에 대한 브레인 스토밍, 주류에 가까운 빅 데이터 단계, 빅 데이터 프로젝트 : 하드웨어 인프라가 간과 되는가, 30 건의 대규모 데이터 프로젝트, 서비스로서의 빅 데이터, 분석 : 갑판에서의 호황

분명히 우리는 1990 년대 후반과 2000 년대 초반에 리눅스와 오픈 소스 소프트웨어 열풍과 동등한 커다란 데이터 과장주기를 겪고 있습니다. 당시 리눅스는 세상을 바꾸고 Microsoft와 다른 것들을 죽일 것입니다. 많은면에서 Linux와 오픈 소스 소프트웨어 (예 : Android)가 모든 것을 바꿔 놓았습니다. 그러나 혁명의 과정에서 재미있는 일이 일어났습니다. 오픈 소스 소프트웨어는 모든 데이터 센터에서 보편화되고 이제 당연한 것입니다. 혁명이 일어 났지만 방금 이야기를 그만 두었습니다. 클라우드 컴퓨팅도 비슷한 방식으로 진행되고 있습니다.

큰 데이터도이주기를 따릅니다. 물론 수백만 개의 일자리가 창출 될 것입니다. 그리고 예, 재능 풀이 조금 늘어납니다. 기업들은 또한 그들의 산업을 재발 명할 것이다. Cloudera와 같은 신생 기업이 새로운 Red Hat이되면 공급 업체의 주문 순서가 변경됩니다. 아마도 일종의 거대한 데이터 반발이있을 것입니다 (클라우드, 지속 가능성 등 참조).

다음은 큰 데이터 진행 상황을 보여주는 방법입니다.

2013 년 :이 2012 년 조종사는 생산 시스템이됩니다. 모든 업종에는 큰 성공 스토리가 있습니다. 이상하게도 성공 스토리는 어디 에나있을 것입니다. 왜? 빅 데이터 프로젝트는 CEO, CFO, CMO 등 비즈니스가 시작합니다. IT는 비용 센터가 아닌 원동력으로 인식됩니다.

Big Data Analytics, 빅 데이터 애널리틱스, DataRobot은 데이터 과학의 저조한 성과를 자동화하는 것을 목표로하고 있으며 Big Data Analytics, MapR 창업자 인 John Schroeder는 사임하고, 대체 할 COO

2014 년 : 2013 년 성공 사례 및 고객 사례 연구를 바탕으로 빠른 추종자가 빅 데이터 게임에 참여합니다. 산업계는 모두 대용량 데이터 플레이 북을 따를 것입니다. 처음에는 이러한 초기 수익률이 좋을 것입니다. 회사는 주로 내부 데이터가 많기 때문에 내부 데이터에 주력합니다. 외부 데이터를 통합하는 것은 좋지만이 단계에서는 더 이상 필요하지 않습니다.

2015 년 : 기업은 대용량 데이터 계획에서 외부 데이터를 살펴보기 시작합니다. 2015 년 이전에는 소비자 대면 회사가 외부 정보를 사용하고 사용하는 데 가장 많은 시간을 보냈습니다. 모든 분석 및 데이터웨어 하우징 스택에는 Hadoop 클러스터와 큰 데이터 계층이 있습니다. Hadoop과 같은 기술은 중요성이 계속 남아 있기 때문에 더 이상 집중하지 않지만 주어진 소프트웨어 스택으로 사라집니다. 거대한 데이터 합병 및 인수로 스팀이 발생합니다.

2016 :이 점에서 큰 데이터는 유토피아로 간주되고 회사는 건방지게됩니다. 항상 그렇습니다. 데이터 중심 의사 결정은 직감과 상식을 대체합니다. 초기 승리와 일반적인 비즈니스 사례가 펼쳐집니다. 이제 회사는 데이터에 대해 정말로 생각하고 의미가없는 오류 및 상관 관계를 피하기 시작해야합니다. 회사가 가설을 부정확하게 거부하고 다른 가설을 채택하고 의미있는 데이터 간의 관계가 있다고 결론을 내리는 등 엄청난 오류가 발생할 것입니다.

2017 : 클라우드는 대용량 데이터 및 데이터웨어 하우징을 서비스로, 분석을 서비스로, 데이터를 서비스로 결합합니다. 통합 작업을 수행하는 자체 Hadoop 클러스터를 실제로 만드는 회사는 거의 없다. 거대한 데이터 인프라가 있습니다. 참고 : 2017은 서비스 작업으로서 이러한 큰 데이터가 대중에게 공통적 일 때의 추측입니다. 서비스 게임으로서의 빅 데이터는 이제 시작되었지만 추후에 임계 질량을 치게 될 것입니다.

IT 구매주기 동안 빅 데이터는 어떻게 재생됩니까? 매우 본질적으로 큰 데이터 프로젝트는 볼 게임에서 더 많은 C 레벨 유형을 필요로합니다. CIO는 여전히 중요합니다. 그리고 틀림없이 기술 결정의 중심입니다.하지만 테이블에 간부가 있습니다. 여기에 고장이있다.

LinkedIn, 새로운 블로깅 ​​플랫폼 발표

Big OLAP 시대인가?

DataRobot은 데이터 과학의 낮은 매달린 열매를 자동화하는 것을 목표로합니다.

MapR 창업자 존 슈뢰더 (John Schroeder)가 물러났다.