O Portal Análise Preditiva fala com Eric Siegel, especialista em data mining e autor do best-seller “Predictive Analytics: The Power to Predict Who is Going to Click, Buy, Lie or Die“. Nesta entrevista, Eric fala sobre as premissas básicas do desenvolvimento de um projeto bem-sucedido de análise preditiva, a adoção da tecnologia no Brasil e o futuro da privacidade.
Qual é o problema mais comum em projetos de análise preditiva?
O problema mais comum em projetos de análise preditiva é, na verdade, organizacional, não técnico. Isso tem a ver com planejamento e nível de apoio ao projeto. Não se trata de um projeto técnico, longe disso. Ele transforma as operações, deixando para trás velhas práticas, introduzindo mudanças, melhorias e a otimização de processos existentes. Portanto, é necessário estar minimamente preparado e aberto. As pessoas devem estar “compradas” na ideia para conseguir provocar uma mudança.
Não raro alguém se empolga com a tecnologia, se tranca numa sala e cria um modelo que acaba nunca sendo usado, lançado. E por lançado eu quero dizer fazer uso dos resultados do modelo, que são as pontuações preditivas produzidas. É necessário integrar essas pontuações às operações para transformar processos existentes, como por exemplo, decidir quem deve receber uma mala direta de marketing ou se uma certa transação deve ser auditada na busca por fraude.
É necessário ter apoio organizacional ao se posicionar a tecnologia, isto é, decidir como usá-la, decidir o que prever e definir como essas previsões serão usadas na operação. Por isso, novamente, apoio é fundamental. E se vier do alto escalão da empresa melhor, já que, vindo de cima para baixo fica mais fácil preparar o terreno antes mesmo de trabalhar os números e desenvolver o modelo preditivo, propriamente.
O que torna um projeto de análise preditiva bem sucedido?
Isso nos remete à resposta anterior, que é conduzir o projeto como um processo organizacional. Agora, a formalização padrão de como organizar e gerir o projeto é conhecida como CRISP-DM, sigla em inglês para, “modelo de processo padrão intersetorial para data mining”, no caso, especificamente modelagem preditiva. Trata-se de um processo iterativo, tanto técnica como organizacionalmente, onde a chave para o sucesso é estabelecer interação entre os tomadores de decisão e a análise dos dados (e data queries) para identificar o que há disponível, o potencial dessa análise e como ela pode ser usada.
Também é importante fazer perguntas sobre os dados, discuti-las em reuniões para definir o modelo e eventualmente avaliar seus resultados, e sendo o caso, introduzir mudanças no processo de preparo dos dados.
Informações sobre o CRISP-DM são facilmente encontradas online e este é o processo geral. Agora, há muitas outras diretrizes técnicas a fim de garantir que o modelo não sofra do que chamamos de “sobre-aprendizagem”. Isto é, garantir que as descobertas reveladas a partir dos dados sejam verdadeiras de modo geral, e não exclusivamente para o conjunto específico de dados que alimenta o modelo. O modelo não deve ficar “viciado” em um conjunto de dados em particular. Essa é a parte mais técnica.
Assumindo que os requerimentos técnicos já estejam satisfeitos, o mais importante para ser bem sucedido é o processo organizacional.
Comparado aos EUA, país líder mundial em análise preditiva, em que estágio de adoção desta tecnologia você diria que se encontra o Brasil?
Eu diria que o Brasil está no mesmo lugar onde os EUA estavam há cerca de dez anos. E isso não deve soar como algo ruim ou um demérito. Isso é algo muito subjetivo, é apenas minha percepção. E particularmente, eu não creio que dez anos seja muito tempo. Eu atuo como consultor independente há 14 anos e trabalho com data mining há 20 anos e minha sensação é a de que tudo vem evoluindo de forma muito rápida.
Eu diria que o Brasil está em uma posição bastante animadora, há muita atividade. As grandes operadoras de telefonia já estão prevendo quais clientes estão mais propensos a cancelar uma assinatura e estou seguro de que muitos varejistas já estão usando a análise preditiva para segmentar campanhas de marketing direto. Identificação de fraude, bancos tomando decisões sobre crédito ao definir a quais clientes oferecer um cartão de crédito. Tudo isso já estava sendo feito nos EUA há 10 anos (e continua sendo).
É uma questão de vermos mais iniciativas em torno de aplicações online, como recomendação de produtos, por exemplo. E é esperado também um maior nível de aplicação da análise preditiva entre empresas de médio porte. Não é algo que deve ficar restrito às grandes empresas, deve haver maior penetração. Os EUA têm sido bem-sucedidos trilhando este caminho e vejo o Brasil fazendo o mesmo.
Com tanta análise em torno de dados dos consumidores, como você vê o futuro da privacidade?
Muito me preocupa o fato de que a questão da privacidade não esteja recebendo a devida atenção. Eu dediquei o segundo capítulo do meu livro integralmente a este assunto. Ou seja, logo no começo do livro, discuto problemas éticos em torno da privacidade. E não estou falando apenas de privacidade de dados sensíveis, como dados sobre seguro saúde de uma pessoa ou quais websites ela acessou. Mas também dados sensíveis que podem ser criados pelo modelo preditivo, como prever se uma mulher está grávida, quem está prestes a pedir demissão e quem vai cometer um crime.
Há muito poder e potencial nos dados. As empresas que detêm e utilizam esses dados têm todas as razões do mundo para continuar a fazê-lo de maneira inteligente. Há uma verdadeira onda neste sentido que pouco provavelmente será contida pela legislação. Em alguns lugares a legislação talvez reduza a velocidade desta onda, idealmente.
Acredito que, do ponto de vista ético, quanto mais as pessoas conhecerem esta tecnologia, quais dados estão disponíveis ou existem, quanto mais transparência houver, melhor. Com um maior nível de conhecimento do público, maior será a qualidade do debate sobre privacidade.
Portanto, não há uma resposta absoluta quando tratamos da privacidade das pessoas. Deve haver um debate bem informado. É isso que eu defendo.
Há um “manual passo-a-passo” sobre como desenvolver um projeto de análise preditiva?
Primeiro, voltamos para minha primeira resposta, em que destaco o processo organizacional. E o que isso significa é encontrar oportunidades que estão à mão, que são mais facilmente acessíveis. Ou seja, identifique as como aplicar a análise preditiva, defina o que você quer prever. É algo sobre comportamento do consumidor? É identificação de fraude? É um cliente com grandes chances de dar um calote em um financiamento? É uma oportunidade de marketing? É um cliente que está prestes a cancelar uma assinatura ou serviço?
Defina quais dessas áreas você quer abordar, quais previsões você quer fazer e como exatamente você pretende utilizar suas previsões para otimizar processos existentes de, novamente, identificação de fraude, satisfação do consumidor, gestão de risco financeiro, esse tipo de coisa.
Portanto, decida exatamente qual é a oportunidade, que é, em grande parte, uma decisão de negócio. E isso também tem a ver com a identificação dos tipos de dados disponíveis, ou dados relevantes, para treinar o modelo. Esta é a primeira etapa e uma etapa muito importante.
O próximo passo, naturalmente, é desenvolver um modelo preditivo. Normalmente é preciso um especialista ou profissional experiente para esse desenvolvimento. Você pode até tentar criar um modelo por conta própria se você for muito ambicioso e tiver um viés tecnológico. Mas se for seu primeiro projeto, pelo menos para desenvolver a parte central do modelo preditivo e fazer uso do software de modelagem preditiva, é uma boa ideia contar com um consultor ou especialista externo (na ausência de profissionais internos), ou empresa especializada neste tipo de serviço.
A última parte do projeto é seu lançamento, isto é, integrar as pontuações preditivas à operação, tornando-a mais eficiente. Este é, portanto, o “esqueleto” de um projeto de análise preditiva.
0 responses on "O Projeto de Análise Preditiva Bem-Sucedido - Entrevista Eric Siegel"