InicioCiencia EducacionLa Wikipedia hacia la web semántica, la web 3.0

La Wikipedia hacia la web semántica, la web 3.0

Ciencia Educacion7/23/2010
Como recurso global, construido a partir del tiempo libre de millones de voluntarios, Wikipedia es el epítome de la Web 2.0. La Fundación Wikimedia, una organización sin fines de lucro, que lleva Wikipedia entre otros proyectos, ahora está pensando en cómo convertirse en la piedra angular de la Web 3.0, o la web semántica.

Esto significa hacer que los 15 millones de artículos (y subiendo) de la Wikipedia sean comprensibles para los ordenadores, además de humanos. Esto permite que el software pueda saber, por ejemplo, que los números mostrados en la tabla con los presidentes de EE.UU. sean fechas. Esto, a su vez, permitiría que las aplicaciones que se basan en Wikipedia generen automáticamente líneas históricas de tiempo o respondan a esa clase de preguntas sobre conocimientos generales que normalmente entrañaría la búsqueda y lectura de la entrada correspondiente en el sitio.

La Wikipedia hacia la web semántica, la web 3.0

En la conferencia sobre tecnología semántica 2010 en San Francisco, el mes pasado, el director de la fundación, Erik Möller, y su colega Trevor Parscal, desarrollador de experiencia de usuario para Wikimedia, mostraba algunos de los primeros pasos de la fundación para estudiar cómo añadir la estructura semántica a las páginas de Wikipedia. También se hizo un llamamiento a la comunidad de la Web semántica, para que puedan ayudar a desarrollar maneras de hacer que el conocimiento de Wikipedia sean más accesible a los ordenadores y al software.

"La Información semántica ya existe en Wikipedia, y la gente ya lo está desarrollando," destacó Möller. "Desafortunadamente, no tenemos ayuda, y tenemos que recurrir a un tratamiento extensivo para llevarlo a cabo."

Un ejemplo es DBpedia, una base de datos semántica, construida con un software que recopila datos de las páginas del sitio, mantenida por la Universidad Libre de Berlín y la Universidad de Leipzig, ambos en Alemania. Otra es Freebase, una base de datos, con ánimo de lucro, donde muchos de sus conocimientos se obtienen de la Wikipedia. Freebase es la fuente de datos utilizada por el motor de búsqueda de pregunta-respuesta de Powerset, adquirida por Microsoft para ser parte integrante del motor de búsqueda de Bing.

Los primeros objetivos de Möller y Parscal son los Plantillas [infoboxes] "que aparecen como resúmenes en forma de tablas en las entradas de muchas páginas de Wikipedia.

"Si esto permite volver a usar los datos de Wikipedia sería una gran cosa", dice Yaron Koren, que dirige una consultora que se especializa en Semantic MediaWiki, una extensión para el software MediaWiki que usa Wikipedia. "Podría eliminarse el trabajo manual que se dirige al mantenimiento de las tablas de muchas listas hoy día", añade. En cambio, las listas podrían ser generadas automáticamente desde las Plantillas de otras páginas. Sería posible incluso generar mapas, usando las coordenadas de ubicación que ofrecen algunas páginas, o generar automáticamente líneas de tiempo para resumir períodos de la historia cubiertos en muchas otras páginas, explicó Möller.

Möller, señala a WikiPics, como ejemplo del tipo de servicio que podría ser habilitado, desarrollado por Daniel Kinzler, en la fundación alemana de Wikimedia. Kinzler entresacó una base de datos de todos los enlaces que conectan las diferentes páginas de la Wikipedia que están disponibles en múltiples idiomas, y construyó una búsqueda de imágenes completamente multilingüe. De tal manera que cuando un usuario pone el término "caballo", por ejemplo, el servicio sepa encontrar también las imágenes de “horse” (inglés), "cheval" (francés) y "Pferd" (alemán). No obstante, por ahora el sitio se basa en un lento proceso de rastreo de toda la Wikipedia para actualizar sus conocimientos. La Wikipedia semántica mantendría una base de datos activa que podría ser consultada en cualquier momento.

Wikipedia encara dos grandes desafíos al abrazar los conceptos semánticos, dice Möller. Uno de ellos es que nadie ha construido un servicio web semántico a la escala que supone un sitio como Wikipedia, y no está claro si existe un software como Semantic MediaWiki que esté a la altura.

El segundo desafío es la característica más responsable del éxito de Wikipedia hasta el momento: su comunidad. "Pensar en añadir una estructura semántica, es una extensión natural de lo que Wikipedia debe hacer, dada las tendencias actuales," considera Andrew Lih, de la Universidad del Sur de California, y autor en 2009 del libro La Revolución de Wikipedia. "Pero hay algo que me preocupa un poco de esta base de datos, la ventaja de las wikis, que ocupa siempre un primer plano, es precisamente que han sido modificadas a mano por seres humanos."


Parscal ha liderado esfuerzos para hacer más fácil que cualquiera pueda añadir o editar los datos almacenados semánticamente. "Hemos estado trabajando en un editor visual que haga sugerencias de cómo podríamos ayudar a los usuarios contribuyentes a estructurar datos, y a su vez, hacer más fácil el proceso de edición", apunta Parscal.

La edición de Wikipedia, ya hoy es un proceso de abrumadoras proporciones que requiere mejorar, admite Parscal. "Si usted ha interactuado con nuestra interfaz", explica, "se habrá topado con wikitext" (un lenguaje de marcado que utiliza un código especial alrededor del texto para dar formato a enlaces, referencias y títulos de las secciones). El wikitext de las tablas o las plantillas [infobox] es particularmente denso y difícil de entender, señala Parscal. "Hace poco hicimos algunos estudios de experiencia del usuario, con gente que no la había usado antes, y vimos como quedaban frustrados rápidamente."

En el futuro será posible eliminar la necesidad de un ser humano para rellenar algunas partes de la Wikipedia, dice Möller. "Fundamentalmente hay una gran cantidad de datos que probablemente no necesiten ser introducidos por el ser humano". Esto es una capacidad que Koren ya ha añadido a Semantic MediaWiki, a través de una extensión llamada ExternalData.
Datos archivados del Taringa! original
0puntos
0visitas
0comentarios
Actividad nueva en Posteamelo
0puntos
2visitas
0comentarios
Dar puntos:

Dejá tu comentario

0/2000

Autor del Post

F
FERNAN0406🇦🇷
Usuario
Puntos0
Posts4
Ver perfil →
PosteameloArchivo Histórico de Taringa! (2004-2017). Preservando la inteligencia colectiva de la internet hispanohablante.

CONTACTO

18 de Septiembre 455, Casilla 52

Chillán, Región de Ñuble, Chile

Solo correo postal

© 2026 Posteamelo.com. No afiliado con Taringa! ni sus sucesores.

Contenido preservado con fines históricos y culturales.