Skip to content

Latest commit

 

History

History
23 lines (19 loc) · 2.07 KB

File metadata and controls

23 lines (19 loc) · 2.07 KB

#Tarea de Scrapy La tarea no es complicada, se pide que para cada post que aparece en la página principal del blog de la Oficina de Software Libre de la UGR, obtener la siguiente información: -Título del post. -Contenido del post. -Identificar las imágenes que contenga, si tiene. -Lista de categorías a las que pertenece el post. Las etiquetas del mismo.

Estos datos deberán ser almacenados en un fichero (por ejemplo en formato XML) y si alguno de estos posts no tiene asignada ninguna etiqueta se almacenarán los datos en otro fichero distinto. La idea de la tarea se puede ver como si de consultas a una base de datos se tratara.

##Sobre la evaluación: -Formato de entrega *Mediante un repositorio. Sube un fichero de texto con la url del repositorio donde tienes la tarea del módulo. *Mediante un archivo comprimido. Sube un archivo comprimido en el que esté el proyecto COMPLETO (archivos, imágenes, etc) con nombre de archivo tal que sea por ejemplo para "Serafín Vélez Barrera" quede como serafin_velez_barrera.tar.bz2 (sin acentos y caracteres especiales salvo el guión bajo como separador de palabras). La extensión del archivo comprimido es de libre elección.

-Puntuación (se puntua sobre 100 puntos) *Si el proyecto no funciona. No obtendrá más de 50 puntos. *Si funciona. Se valorará a partir de 50 puntos de forma que: -Si es un proyecto funcional con lo mínimo requerido la puntuación será entre 50 y 60 puntos. Dependerá de la calidad del código (simpleza, comentarios, etc) -Si el proyecto está alojado en GitHub se incrementará en 10 puntos la nota. Si usas esta vía de entrega añádeme en la plataforma (@seravb). -Toda característica extra se valorará con 10 puntos cada una (tratamiento de excepciones, inclusión de licencia libre, originalidad de la idea, control de señales, eventos, funciones asociadas, control de errores básicos, etc) hasta llegar a los 90 puntos.

###Anotaciones extra Si usas el formato de entrega usando GitHub es recomendable hacerlo desde el principio para no subir todos los cambios de una sola vez ;)