Noticias
null Divulgatic: Extracción de datos y detección de malware
Divulgatic: Extracción de datos y detección de malware
Una sección a cargo de Javier García sobre herramientas, recursos, ideas, curiosidades o novedades para creadores de contenidos, desarrolladores, y gente interesada en la tecnología en general
Javier García
Sección de Telemática
EXTRACCIÓN DE DATOS DE PÁGINAS SIN PROGRAMACIÓN
Muchas veces necesitamos analizar o transformar datos que aparecen en una web. Las hojas de cálculo de Google tienen algunas funciones que nos permiten realizar este trabajo sin tener grandes conocimientos de programación. En concreto disponemos de funciones como IMPORTHTML que podemos combinar con funciones de selección. Por ejemplo, podemos importar al vuelo en una hoja de cálculo, los datos de los ganadores de Eurovisión desde el año 2000 por ejemplo a partir de la información que aparece en la wikipedia. Para ello primero usamos la función para extraer la tabla.
IMPORTHTML ("https://es.wikipedia.org/wiki/Anexo:Ganadores_del_Festival_de_la_Canci%C3%B3n_de_Eurovisi%C3%B3n"; "table"; 1)
Si queremos seleccionar sólo las primeras columnas y quedarnos aquellas que sean desde el 1980 usamos además la función QUERY:
=query(IMPORTHTML("https://es.wikipedia.org/wiki/Anexo:Ganadores_del_Festival_de_la_Canci%C3%B3n_de_Eurovisi%C3%B3n"; "table"; 1);"SELECT Col1, Col2, Col3, Col4, Col5 WHERE Col1 >= 1980 ORDER BY Col1 DESC")
O bien podemos por ejemplo importar un CSV para realizar nuestras propias gráficas. Por ejemplo, podemos usar los ficheros .CSV que genera UMU en cifras usando la función IMPORTDATA y hacer un gráfico a partir de los datos de edad Media del año 2022 en distintos colectivos:
=query(IMPORTDATA("https://www.um.es/umuecws/UMUc/generaFicheros/generaCSV.php?pCodInforme=88");"SELECT * WHERE Col1=2022 AND Col3='7'")
COMPROBAR SI UNA URL O UN FICHERO CONTIENE MALWARE
VIRUSTOTAL
Virustotal es una excelente ayuda cuando no sabemos o tenemos dudas de si una URL o un fichero es o no maliciosa. Al acceder a la misma podemos indicarle cualquiera de las dos opciones y de forma gratuita realiza un escaneo entre su base de datos de antivirus. Además, recientemente ha anunciado la incorporación de Code Insight, que realiza mediante técnicas de IA un análisis del comportamiento fácilmente interpretable por los usuarios del comportamiento del malware. De momento para sólo algunos tipos de ficheros como: PowerShell, Batch, Shell Scripts, VBScript,...
Gracias por leernos y si conoces alguna que creas que podemos publicar nos la puedes mandar a: divulgatic@um.es