ANÁLISE DE AGRUPAMENTOS SOBRE TEXTOS: UM ESTUDO DOS RESUMOS DO BANCO DE TESES E DISSERTAÇÕES DA CAPES
UM ESTUDO DOS RESUMOS DO BANCO DE TESES E DISSERTAÇÕES DA CAPES
DOI:
https://doi.org/10.48090/ciki.v%25vi%25i.589Palabras clave:
Agrupamento de Documentos, Dados Abertos, Mineração de Dados, Kmeans, Descoberta de conhecimento em textoResumen
O processo de descoberta de conhecimento em grandes volumes de informação tem um amplo campo de aplicação. As principais tarefas de classificação, agrupamento e associação têm sido utilizadas em diferentes áreas do conhecimento para tornar possível a identificação de conhecimento útil em grandes volumes de dados. Neste artigo, é analisada a aplicação de técnicas de mineração de dados, notadamente o algoritmo de agrupamento K-Means, com o objetivo de verificar sua efetividade para análise de dados oriundos do Portal Brasileiro de Dados Abertos, um repositório de dados público organizado e disponibilizado à população. O conjunto de dados utilizado para a aplicação do algoritmo de agrupamento foi extraído das informações disponibilizadas sobre o banco de teses e dissertações disponibilizadas pela CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior). Os dados foram tratados e inseridos na plataforma Apache Solr® onde foram indexados, sendo os agrupamentos gerados a partir do software Carrot2, utilizando-se o algoritmo K-Means com configurações customizadas. Os agrupamentos foram gerados ano a ano e de forma consolidada, com diferentes configurações do algoritmo, tornando possível a comparação entre os termos obtidos. Concluiu-se que os resultados das ferramentas utilizadas estão diretamente relacionados com a escolha do número de agrupamentos iniciais, mas a potencialidade para a descoberta de agrupamentos não óbvios é evidente.
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
DECLARACIÓN DE CESIÓN Y TRANSFERENCIA DE DERECHOS PATRIMONIALES SOBRE ARTÍCULO PUBLICADO EN LAS ACTAS CIKI Y AUTORIZACIÓN PARA PUBLICACIÓN
EL AUTOR, de conformidad con la ley n. 9.610 de 19 de febrero de 1998, por el presente instrumento particular, declara a quien pueda interesar, que cede y transfiere, en carácter universal, definitivo, irretratable, con exclusividad y com carácter gratuito, la totalidad de sus derechos patrimoniales de autor sobre el artículo sometido al Congreso Internacional de Conocimiento e Innovación - ciki, para publicación en las actas del evento.
El AUTOR garantiza:
- Que el artículo es original, exceptuando las citas de otras obras publicadas, desde que observadas las limitaciones expresadas en los artículos 46 y 47 de la Ley 9.610 de 19.02.1998;
- Que el artículo no contiene ninguna declaración calumniosa o difamatoria y que no infringe los derechos de propiedad intelectual, comercial o industrial de terceros;
- Resarcir prontamente el Congreso Internacional de Conocimiento e Innovación - ciKi por cualquier indemnización, perjuicio o gasto que ocurra por la quiebra de las garantías expresadas en los apartados 1 y 2 anteriores.
Con esta cesión y transferencia de los derechos patrimoniales referentes al derecho del autor, el Congreso Internacional de Conocimiento e Innovación - ciKi y sus sucesores quedan libres de cualquier pago de derechos de autor al AUTOR o a sus herederos o sucesores.
El AUTOR declara, además, que el Congreso Internacional de Conocimiento e Innovación - ciKi está plenamente autorizado a utilizar dicho artículo, en su totalidad o en parte, editado o completo, en lengua portuguesa y en todas las demás lenguas, en versión impresa, en medio electrónico, Internet, para fines comerciales o no, incluso pudiendo distribuir, adaptar, crear obra derivada, ceder sus derechos a terceros, en Brasil y / o en el exterior, incluyendo, pero no limitándose a fines de: enseñanza, estudio e investigación; publicación y divulgación; uso en medios de telecomunicación en general; uso audiovisual en general, incluidas todas las tecnologías digitales existentes o que se desarrollen en el futuro, aptas para el almacenamiento y la reproducción de datos.
Quedan asegurados al AUTOR los derechos morales sobre su artículo, incluyendo la vinculación de su nombre como autor del artículo objeto de esta transferencia.
El AUTOR deberá siempre realizar consulta por escrito al Congreso Internacional de Conocimiento e Innovación - ciKi, cuando pretenda cualquier tipo de utilización del trabajo cedido, obligándose siempre a insertar el crédito a la publicación original de su artículo, citando la referencia bibliográfica completa, de modo legible y con destaque.