Wikia Search Alpha, el buscador tipo wikipedia

Se lanzó el 7 de Enero, hasta donde pude averiguar, estaba prevista para noviembre del 2007, asi que nos llega con dos meses de retrazo,…

Wikia Search es un buscador que pretende llevar la filosofía “open-source” al mundo de los buscadores, según afirma Jimmy Wales (fundador de wikipedia) en la página principal de wikia: “Buscar es una parte fundamental de la estructura de Internet, y la estamos haciendo open-source

Lo que se puede ver en este buscador, que aún esta en etapa de pruebas, son algunas cosas que pasaré a mencionar a continuación:

Un intefaz simple con una amplia caja de búsqueda mas el icono de “Go” es punto de inicio el para tener acceso los 50-100 millones de páginas que dice tener indexadas en su base de datos.

Luego de una búsqueda simple, que de momento va un poco lenta (20 segundos para algunos casos)

http://re.search.wikia.com/search#chill%20out

se pueden apreciar los 2 puntos que anuncian como novedad:

1. la invitación a escribir mini-artículos sobre las búsquedas que el usuario realiza y así mejorar la calidad de sus resultados con las aportaciones de los usuarios
miniarticulo.gif

2. la posibilidad de contribuir a mejorar el ordenamiento de las páginas mostradas, permitiendo votar por los enlaces mostrados (esta funcionalidad parece estar desabilitada temporalmente)
votar.gif

Repecto al primer punto, de los mini-artículos, aqui wikia hace uso de toda la experiencia que tiene para recibir contribuciones de usuarios; las páginas de edición de contenido se parecen mucho a lo que utiliza wikipedia.org, tanto es así que incluso el proceso de aportar imágenes incluye todo el protocolo ya conocido de escoger licencias para los derechos de autor, además, permite poder ver el historial de las aportaciones de los artículos, editar contenido, etc.

Sobre los demás resultados del listado, parece que aún requiere ser mejoras sustanciales, comenzando por la actualización del los índices que de seguro no es tan fácil, por ejemplo, buscando: “wikia search alpha” vemos que el buscador no se encuentra a sí mismo :)

Sin embargo, ofrece la posibilidad de probar índices diferentes par la misma búsqueda

- whilelist es un index que se dice que todo crawler (araña) debe considerar como punto de partida, esta compuesto de aproximadamente 35 millones de enlaces Top.

- Smaller Test ( no encontré info)

- Visvo al parecer es otro índice público basado en Nutch

index.gif

Otra cosa que se puede encontrar es la posibilidad de ver usuarios que coinciden con la búsqueda realizada, no me queda claro si lo hacen por el texto del perfil de usuario, por las búsquedas realizadas, o ambos pero es una buena herramienta para crear una pequeña red de contactos.

contact.gif

Adicionalmente tiene la opción de ver el caché de la página veo que lo sacan de Nutch y muestran un enlace de cache + un número que no sé que significa y tal vez deberían quitarlo.
una cosa interesante es la forma en que tienen la paginación, no muestra la cantidad exagerada de número que tienen otros buscadores, simplemente muestran un botón verde para ver los resultados en la misma página.
pagt.gif

Conclusion
Ventajas
- la posibilidad de escribir mini artículos
- valorar de otra los enlces votados por los usuarios
- poder formar una red social de contactos según perfil/busquedas
- estoy seguro que las aportaciones de usuario servirán para mejorar la wikipedia
- la edición de artículos tiene todo el soporte para controlar licencias y derechos de autor
- ser un búscador open source, aunque no encontré el sitio de donde descargar el código, seguro que esta filosofía le va a traer varios beneficios al proyecto

Desventajas
- lento
- índices desactualizados
- existen escasos mini-artículos
- la votación de enlaces puede llegar a ser viciada
- el proceso de agregar contenido esta muy “wikiizado”, me refiero a que crear un artículo le puede tomar varios minutos a alguien nuevo que no es editor de wikipedia ni conoce mucho de licencias creative commons, cuando salga knol wikia va a ser historiA, la clave: SIMPLICIDAD-USABILIDAD
- posiblemente una página de estos mini-artículos no llegue a tener tan buena información como un artículo de la wikipedia o puede llegar a tener lo mismo, de todos modos se gana como un ingreso de más conocimiento compartido por usuarios aunque no creo que el interfaz actual sea de mucha ayuda

finalmente yo lo veo como un buscador que se quiere parecer a mahalo pero no deja de lado su “wiki filosofía”, tiene muchos problemas en su índice, tal vez sea por usar varios índices open source como fuentes de enlaces…

aqui dejo una búsqueda a la que le pude agregar un mini-artículo

http://re.search.wikia.com/search#puno%20ciudad

sobre el autor y este blog

bueno, me comencé a interesar por el mundo de los buscadores a mediados del año 2004, mi primer proyecto consistió en hacer un buscador de imágenes basado en contenido utilizando técnicas de CBIR, algo parecido a WebSEEK … fue un largo camino que me llevó a busear por una considerable cantidad artículos, páginas, papers, libros, programas hechos y cuanta información pude encontrar al respecto…

mi primer trabajo práctico , y ya financiado :) fue hacer un buscador de noticias: araña + índice + interfaz… (eso fue el año 2005) Y es entonces que comenzó el largo camino (que hasta ahora no termina) de ver diariamente todo tipo de problemas que se presentan al tratar de construir y poner en funcionamiento aplicaciones web de este tipo.

- Cosas como indexar páginas con codificación UTF8 o ISO, ( ¿cómo detectar una página en utf8? )
- hasta saber qué poner en el botón de Buscar (¿Encontrar?, ¿Ir?, ¿Ir a?, ¿–no poner nada–? )

actualmente trabajo remotamente para una empresa que apuesta por un nuevo tipo de buscadores, de aquellos llamados buscadores sociales en los cuales se aprovecha el conocimento colectivo de los usuarios para ofrecer resultados de calidad.

entonces.. el propósito de este blog, que espero tenga buena acogida ( es uno de mis objetivos para el 2008 ) es comentar sobre buscadores, lanzamientos, noticias, trucos y cualquier cosa que encuentre relevante y que pueda ayudar a sacar el mejor beneficio de este tipo de herramientas.

search engines

Escrito en General. Etiquetas: . Deja un Comentario »
Seguir

Get every new post delivered to your Inbox.