Data Science: Big Data, Data Mining e Analytics

 




ūüďÖ 07/11/2019

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

08:15 ‚Äď 08:35

A utiliza√ß√£o de minera√ß√£o de dados no CCIMAR como aux√≠lio ao processo de auditoria nas licita√ß√Ķes da Marinha do Brasil.

08:35 ‚Äď 08:55

Proposta de melhoria no processo de combate à criminalidade na cidade do Rio de Janeiro.

08:55 ‚Äď 09:15

Mineração de Dados: um estudo para identificação do perfil docente das IES com conceito 3 ou superior no IGC avaliado em 2016 no estado do Espírito Santo.

09:15 ‚Äď 09:35

Gestão da segurança operacional em tempo real utilizando ferramentas de analytics: a experiência da itaipu binacional.

09:35 ‚Äď 09:55

Descoberta de conhecimento em base de dados de projetos de inovação: um estudo em um polo EMBRAPII.

09:55 ‚Äď 10:10

Intervalo

10:10 ‚Äď 10:30

Classificação de falhas de um centro de usinagem: um estudo de caso utilizando árvore de decisão.

10:30 ‚Äď 10:50

Investidores do tesouro direto exploração do comportamento dos investidores utilizando mineração de dados.

10:50 ‚Äď 11:10

An√°lise de variedades RB da cana-de-a√ß√ļcar utilizando t√©cnicas de minera√ß√£o de dados.

11:10 ‚Äď 11:30

Otimização de processo produtivo através de Mineração de Dados.

11:30 ‚Äď 11:50

A mineração de dados para seleção de heurísticas no problema de empacotamento bidimensional retangular.

 

ARTIGO 1: A UTILIZA√á√ÉO DE MINERA√á√ÉO DE DADOS NO CCIMAR COMO AUX√ćLIO AO PROCESSO DE AUDITORIA NAS LICITA√á√ēES DA MARINHA DO BRASIL.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 08:15 ‚Äď 08:35

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Ewerton Gonçalves (Marinha do Brasil)

George Costa (CIANB)

Resumo: O objetivo deste trabalho √© verificar a viabilidade da utiliza√ß√£o de t√©cnicas de Minera√ß√£o de Dados nas auditorias conduzidas pelo Centro de Controle Interno da Marinha (CCIMAR) na √°rea de licita√ß√Ķes. Para tal, foi necess√°rio conceituar Minera√ß√£o de Dados e seus termos associados, bem como sua conex√£o com auditoria cont√≠nua e licita√ß√Ķes para, em seguida, propor um ambiente pr√≥prio e adequado ao uso de Minera√ß√£o de Dados, a fim de utilizar esta ferramenta em prol da organiza√ß√£o como um apoio adicional √†s auditorias em licita√ß√Ķes da Marinha.

Download Artigo Completo

 

ARTIGO 2: PROPOSTA DE MELHORIA NO PROCESSO DE COMBATE À CRIMINALIDADE NA CIDADE DO RIO DE JANEIRO.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 08:35 ‚Äď 08:55

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Marcone Freitas dos Reis (SENAI CETIQT)

Vitor Ribeiro Cuervo (SENAI CETIQT)

Marcos dos Santos (IME)

Angélica Lima (SENAI CETIQT)

Ernesto Rademaker Martins (CASNAV)

Resumo: Os √≠ndices de criminalidade nos grandes centros urbanos t√™m se intensificado nos √ļltimos anos, devido ao aumento populacional e a falta de infraestrutura nas cidades. Em paralelo, a tecnologia de informa√ß√£o, dispositivos m√≥veis e sensores alavancam um novo paradigma aonde vem sendo gerado um grande volume de dados. Tendo em vista que h√° um avan√ßo t√≠mido nas pr√°ticas de integra√ß√£o da gest√£o p√ļblica, n√£o raros tomadas de decis√£o acontecem de forma desarticulada e imprecisa. O objetivo do presente trabalho √© propor melhorias no processo de combate √† criminalidade na cidade do Rio de Janeiro, sugerindo a utiliza√ß√£o do Big Data para coletar os dados, e onde esse grande volume de dados d√° base √†s tomadas de decis√£o integradas dos setores da gest√£o municipal. O m√©todo utilizado para a pesquisa envolveu o estudo te√≥rico sobre o tema e o levantamento de exemplos de utiliza√ß√£o do Big Data. A partir do levantamento dos √≠ndices de criminalidade no bairro da Tijuca situado na zona norte da cidade do Rio de Janeiro, √© apresentado uma proposta de melhoria no combate √† criminalidade para o aux√≠lio da gest√£o p√ļblica integrada e base √†s tomadas de decis√£o.

Download Artigo Completo

 

ARTIGO 3: MINERA√á√ÉO DE DADOS: UM ESTUDO PARA IDENTIFICA√á√ÉO DO PERFIL DOCENTE DAS IES COM CONCEITO 3 OU SUPERIOR NO IGC AVALIADO EM 2016 NO ESTADO DO ESP√ćRITO SANTO.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 08:55 ‚Äď 09:15

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

André da Silva (Faculdade Multivix Cachoeiro de Itapemirim)

Denilton de Paula (IFES Viana)

Resumo: A identifica√ß√£o do perfil docente para as institui√ß√Ķes de ensino superior no estado do Esp√≠rito Santo, que possuem um √≠ndice satisfat√≥rio ou superior no IGC. Neste trabalho de pesquisa o objetivo √© aplicar t√©cnicas de minera√ß√£o de dados para extrair informa√ß√Ķes relevantes da base de dados do censo superior de 2016, disponibilizados pelo INEP, sendo utilizado como metodologia uma pesquisa de revis√£o bibliogr√°fica para conceitua√ß√£o de termos e algoritmos de minera√ß√£o dados a serem utilizados na pesquisa, bem como discernimento dos processos e indicadores que o MEC leva em considera√ß√£o para avaliar uma institui√ß√£o de ensino superior no Brasil, sendo aplicado tamb√©m o tratamento dos dados anterior a fase de minera√ß√£o e aplica√ß√£o do processo do KDD. A pesquisa resulta na cria√ß√£o de clusters de informa√ß√Ķes, que agrupa os dados da minera√ß√£o em 7 grandes grupos, al√©m de detalhar algumas ramifica√ß√Ķes contidas na arvore de decis√£o criada com base no algoritmo J48. Com este trabalho, podemos concluir que a minera√ß√£o de dados se apresenta como uma ferramenta poderosa para extra√ß√£o de conhecimento, que nos possibilitou tra√ßar perfis dos docentes capixabas das institui√ß√Ķes com IGC 3 ou superior.

Download Artigo Completo

 

ARTIGO 4: GESTÃO DA SEGURANÇA OPERACIONAL EM TEMPO REAL UTILIZANDO FERRAMENTAS DE ANALYTICS: A EXPERIÊNCIA DA ITAIPU BINACIONAL.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 09:15 ‚Äď 09:35

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Juliano Portela (Itaipu Binacional)

Resumo: Organiza√ß√Ķes s√£o continuamente desafiadas a manter altos n√≠veis de produtividade sem que sejam descuidados aspectos referentes √† seguran√ßa das pessoas, instala√ß√Ķes e meio ambiente. Paradoxalmente, em organiza√ß√Ķes cujas consequ√™ncias socioecon√īmicas de eventuais falhas operacionais s√£o elevadas, n√£o raro o trade-off entre produ√ß√£o e seguran√ßa operacional √© desafiado, uma vez que as caracter√≠sticas de redund√Ęncia e sobredimensionamento de seus sistemas de seguran√ßa diminuem consideravelmente a probabilidade de falhas na opera√ß√£o. Esta realidade, no entanto, n√£o as eximem de constantemente revisitar sua capacidade de monitorar, antecipar e responder a eventos de risco, tornando-as resilientes. Para lograr √™xito em tal empreitada, √© importante evoluir a gest√£o da seguran√ßa: de reativa, baseada na an√°lise retrospectiva de eventos, para proativa, capaz de prover em tempo real a consci√™ncia situacional do estado das instala√ß√Ķes e de eventuais vulnerabilidades n√£o previstas. Este trabalho apresenta um dos caminhos que a Itaipu vem tomando no sentido de abordar proativamente sua seguran√ßa operacional: uma ferramenta de visualiza√ß√£o em tempo real, de alto n√≠vel, de uma estrutura hier√°rquica de seis n√≠veis, que capta mais de 15.000 pontos da instala√ß√£o, desde o n√≠vel de processo, combinando-se atrav√©s de pesos e c√°lculos estruturados at√© o n√≠vel de um indicador que representa a vis√£o geral da seguran√ßa operacional da Itaipu Binacional, suas subesta√ß√Ķes, sistemas auxiliares, casa de for√ßa e barragem.

Download Artigo Completo

 

ARTIGO 5: DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS DE PROJETOS DE INOVAÇÃO: UM ESTUDO EM UM POLO EMBRAPII.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 09:35 ‚Äď 09:55

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Bruno Paix√£o (IFF)

Leonardo Barroso (IFF)

Marcus Toffano (IFF)

Henrique da Hora (IFF)

Rogério de Carvalho (IFF)

Resumo: Contexto: Atualmente a informa√ß√£o √© um dos ativos mais importantes das organiza√ß√Ķes, por√©m √© preciso transformar dados em conhecimento. Deste modo a minera√ß√£o de dados (MD) tem um importante papel nas an√°lises das informa√ß√Ķes e na descoberta de padr√Ķes. Neste trabalho foram utilizadas t√©cnicas de MD com o aux√≠lio do software WEKA para sele√ß√£o de atributos, classifica√ß√£o e agrupamento de informa√ß√Ķes de projetos do p√≥lo de inova√ß√£o do Instituto Federal Fluminense. Objetivo: Identificar padr√Ķes dentro do conjunto dos dados dos projetos de inova√ß√£o realizados pelo IFF de modo a gerar conhecimento e otimizar a gest√£o de projetos futuros. Metodologia: Inicialmente foi realizada a extra√ß√£o das informa√ß√Ķes a partir da base de dados de projetos do Polo de Inova√ß√£o de Campos dos Goytacazes. Em seguida foram selecionados atributos relevantes para minera√ß√£o, com a adequa√ß√£o dos dados para obten√ß√£o de melhores resultados. Por fim, houve a execu√ß√£o do algoritmo de classifica√ß√£o e gera√ß√£o da √°rvore de decis√£o que permitiu revelar informa√ß√Ķes dos projetos antes escondidas. Resultado: Os resultados descritos nos diversos ramos da √°rvore de decis√£o variam em termos de perfis de usu√°rio, tipos de tarefas e tempo gasto. S√£o reveladas itera√ß√Ķes entre perfis de usu√°rio espec√≠ficos, como Gerente/Coordenador e Bolsista/Estagi√°rio, organiza√ß√£o de atividades de autoria pr√≥pria dos Pesquisadores e poss√≠vel mudan√ßa no rol de tarefas de desenvolvimento, apontando muitas atividades sem registro de horas. Conclus√Ķes: Ap√≥s a sele√ß√£o dos atributos e gera√ß√£o das √°rvores de decis√£o, foi poss√≠vel interpretar e descrever as rela√ß√Ķes entre os atributos das tarefas, revelando informa√ß√Ķes sobre os projetos. Os resultados podem ser comparados com artefatos de projetos existentes ou ainda servir de entrada para novos projetos do escrit√≥rio de projetos. Novas descobertas de conhecimento na mesma base de dados podem ser experimentadas se novos cen√°rios forem aplicados e novos algoritmos, como o K-means.

Download Artigo Completo

 

ARTIGO 6: CLASSIFICA√á√ÉO DE FALHAS DE UM CENTRO DE USINAGEM: UM ESTUDO DE CASO UTILIZANDO √ĀRVORE DE DECIS√ÉO.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 10:10 ‚Äď 10:30

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Higor Velloso (IFF)

Henrique da Hora (IFF)

Resumo: As empresas est√£o cada vez mais buscando atingir uma performance de alto n√≠vel para se manter em um ambiente caracterizado por intensa competitividade global. Uma das formas de atingir o n√≠vel qualidade e excel√™ncia desejado √© dando foco nas fun√ß√Ķes de verifica√ß√£o das atividades de manuten√ß√£o. Na √°rea de manufatura industrial, os centros de usinagem representam o que h√° de mais avan√ßado no quesito tecnologia, e paradas indesejadas podem gerar preju√≠zos para as companhias. Para um melhor controle de detec√ß√£o e reconhecimento de falhas, a fim de atingir um maior per√≠odo de disponibilidade deste maquin√°rio, diversos autores utilizam ferramentas de intelig√™ncia artificial, como √°rvores de decis√£o e SVM, entre outros. Este trabalho tem como objetivo aplicar a t√©cnica de √°rvore de decis√£o um dataset composto pelo hist√≥rico de falhas de um centro de usinagem no per√≠odo de mar√ßo de 2016 a outubro de 2018, sendo que cada evento possui 4 atributos: Falha, Componente em falha, Tempo at√© a falha e Tempo da √ļltima manuten√ß√£o. No ambiente WEKA, foi utilizado o algoritmo J48 com valida√ß√£o do tipo cross-validation com 10 subconjuntos e um n√ļmero m√≠nimo de 7 objetos por folha para gerar um modelo que possui como desfecho o atributo Falha e outro para Componente em falha. Ao fim do trabalho, obteve-se que o sistema hidr√°ulico √© o componente de maior criticidade deste tipo de maquin√°rio, uma vez que possui o maior n√ļmero de eventos tanto para o atributo Falha, quanto para Componente em falha. Apesar dos modelos terem obtido taxas razo√°veis de acur√°cia, percebe-se que eles possuem algumas falhas.

Download Artigo Completo

 

ARTIGO 7: INVESTIDORES DO TESOURO DIRETO EXPLORAÇÃO DO COMPORTAMENTO DOS INVESTIDORES UTILIZANDO MINERAÇÃO DE DADOS.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 10:30 ‚Äď 10:50

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Raphael Sales (IFF)

Henrique da Hora (IFF)

Resumo: Do ponto de vista do investidor comum (pessoa física), o tesouro direto é uma alternativa atrativa de investimento na renda fixa com menores custos de transação uma vez que elimina intermediários. A partir de uma base de dados do cadastro dos investidores do Tesouro Direto no Brasil do site: dados.gov.br, este trabalho buscou utilizar técnicas de mineração de dados como a clusterização e árvore de indução a fim de traduzir o comportamento dos investidores do Tesouro Direto. As técnicas realizadas no banco de dados foram aplicadas de modo que identificassem o comportamento e o perfil do investidor através da mineração de dados, sendo esse usuário inativo ou ativo, identificando características recorrentes entre eles. Dentre os meses analisados, podemos chegar a um perfil comum como sendo do sexo masculino, casado e com idade média de aproximada de 45 anos.

Download Artigo Completo

 

ARTIGO 8: AN√ĀLISE DE VARIEDADES RB DA CANA-DE-A√á√öCAR UTILIZANDO T√ČCNICAS DE MINERA√á√ÉO DE DADOS.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 10:50 ‚Äď 11:10

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Isabela Terra (IFF)

Milton Jr. (UCM)

Tamys Fernandes (UFRRJ)

Henrique da Hora (IFF)

Resumo: The objective of this work was to use data mining techniques to verify the relation of the characteristics of the sugarcane germplasm collection with the Brazilian Republic (RB) of the Germplasm Asset Bank (BAG) 2018 of the Rede Interuniversitária para o Desenvolvimento do Setor Sucroenergético (RIDESA). Used records of 414 accesses of RB and 10 attributes. For the analysis of the classification task, using the binary decision tree method, the potential of the decision tree model was evaluated in relation to the BRIX, TONNED/HECTARE AND BUDDING of each genotype. From the results obtained, Brix presented a 60.6% accuracy of the instances with the decision tree indicating direct influence of the Maturation; in relation to Tonned/Hectare presented a hit in 56.2% of the instances with the decision tree pointing to the influence of the tillering; and in relation to Budding showed a hit in 74.6% of the instances with the decision tree indicating influence of the tillering followed by the Tonned/Hectare.

Download Artigo Completo

 

ARTIGO 9: OTIMIZA√á√ÉO DE PROCESSO PRODUTIVO ATRAV√ČS DE MINERA√á√ÉO DE DADOS.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 11:10 ‚Äď 11:30

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Anderson de Lima (IFF)

Bruno Pereira (IFF)

Henrique da Hora (IFF)

Alline Morais (UENF)

Resumo: Atualmente em todos os setores a concorr√™ncia se destaca como um desafio que tem que ser superado a cada instante pelas corpora√ß√Ķes. Nesse sentido qualquer que sejam os diferenciais competitivos desenvolvidos, podem trazer grandes ganhos relacionados √† produtividade. Este estudo mostra como uma inova√ß√£o aplicada atrav√©s da ci√™ncia de Minera√ß√£o de Dados pode trazer enormes ganhos num processo produtivo, otimizando custos, diminuindo o tempo de resposta e aumentando a assertividade nas tomadas decis√£o.

Download Artigo Completo

 

ARTIGO 10: A MINERA√á√ÉO DE DADOS PARA SELE√á√ÉO DE HEUR√ćSTICAS NO PROBLEMA DE EMPACOTAMENTO BIDIMENSIONAL RETANGULAR.

Tópico do Artigo: Data Science: Big Data, Data Mining e Analytics

Data: 07/11/2019

Hor√°rio: 11:30 ‚Äď 11:50

Local: Pr√©dio CEMOI ‚Äď Sala BRAVO

Autores:

Alvaro Neuenfeldt J√ļnior (UFSM)

Resumo: O problema de empacotamento bidimensional retangular em faixas consiste em posicionar um conjunto de pequenos ret√Ęngulos em uma faixa de largura fixa e comprimento virtualmente infinito, minimizando a comprimento necess√°rio para posicionar todos os ret√Ęngulos. O objetivo geral deste projeto √© ajustar modelos de classifica√ß√£o de algoritmos capazes de selecionar, com acur√°cia, a melhor op√ß√£o de heur√≠stica de melhoria de acordo com as caracter√≠sticas de cada inst√Ęncia do problema de empacotamento bidimensional retangular em faixas. A metodologia de pesquisa est√° baseada no uso de t√©cnicas supervisionadas de minera√ß√£o de dados para o ajuste de modelos de classifica√ß√£o de algoritmos. O enfoque est√° na sele√ß√£o das heur√≠sticas que possuem um maior potencial de encontrar solu√ß√Ķes de qualidade para o problema, somente utilizando como informa√ß√£o as caracter√≠sticas das inst√Ęncias utilizadas. Ap√≥s a condu√ß√£o da pesquisa foi poss√≠vel observar que as t√©cnicas supervisionadas de minera√ß√£o de dados support vector machine with polynomial kernel foi efici√™ncia no que tange a busca pela melhor op√ß√£o de heur√≠stica de melhoria para o contexto do 2D-SPP. Ainda, notou-se que as caracter√≠sticas das inst√Ęncias s√£o capazes de remeter informa√ß√Ķes importantes para a resolu√ß√£o do problema.

Download Artigo Completo