Preguntas frecuentes sobre ZIVIS (Blog de Zivis)

19/05/2007

Zivis presentado en IBERGRID

La semana pasada varios miembros del BIFI estuvimos a IBERGRID, un congreso celebrado en Santiago de Compostela que reunió a más de 200 expertos en computación. Allí presentamos Zivis con notable éxito y pudimos comprobar la gran repercusión que el proyecto ha tenido a nivel nacional. También pudimos ver el trabajo de otros grupos en computación voluntaria, como las experiencias de compañeros de la Universidad de Extremadura para introducir la virtualización en sistemas BOINC.

Más información:
http://www.ibergrid.eu
---

19/05/2007 21:33 #. No hay comentarios. Comentar.

18/05/2007

Videos de zivis

Un video de la presentacion inicial en el Ayuntamiento

Una entrevista a Alfonso Tarancon en el canal 24h que nosotros no llegamos a grabar pero AupaZaragoza si

Con motivo del dia de internet los de Cuatro decidieron hablar de nuestro proyecto de supercomputacion voluntaria y sacaron dos notas, una breve en el telediario de la mañana y otra mas larga en el de la noche, helas:

18/05/2007 22:04 #. No hay comentarios. Comentar.

16/05/2007

Los Robots dichosos

Ahora que estamos mas relajados me he dado un paseo hasta la biblioteca y resulta que habia en el Investigacion y Ciencia un articulo sobre robots por Bill Gates. Ya hablaron de ello en Barrapunto, pero el 30 de Enero, y en ese momento ya no estaba yo (no estabamos, me temo, nadie del equipo) para lecturas de ocio. El caso es que el articulo trae una foto en la que aparecen juntos el Lego Mindstorms y la Roomba. En el caso de Zivis, la primera idea de la categoria "geek" era una Roomba pero, al ver que era dificil traer un ultimo modelo desde USA, se opto por dar un Mindstorms y un Fischertechnik. Incluso pusimos links en la pagina de premios, convencidos de que el Fishertechnick no lo conocia nadie.

DSC04983


Pues bien, el post de Barrrapunto envia a la pagina de robotica de microsoft y alli, lo gracioso es que hay el parrafito dice "Microsoft Robotics Studio is compatible with many third-party robots, including those from fishertechnik, LEGO, irobot, and many others including:...". Sospecha uno que los "many others" son los que han pagado a MicroSoft por salir alli, y los otros los que tienen ya el prestigio ganado.


Asi que ya veis, estamos regalando, despues de todo y sin saberlo, tecnologia a la ultima... recomendada por el propio Gates. En realidad el Lego se programa con una version de LabView, que es un software que se invento para el Macintosh II (de hecho, para el Plus, pero el Mac Plus solo tenia puertos serie). Y el fishertechnik creo que ha llevado de siempre software propio, aunque yo he visto a Daniel Fernandez de Velasco desarrollar controladores desde VIC-20 y Mac para controlar el suyo. Habra que ver si Cuartielles nos cuenta algun dia como controlarlos con Arduino y su soft.

Alejandro

16/05/2007 23:21 #. No hay comentarios. Comentar.

14/05/2007

Fotos de la entrega de premios

    Un monton, en flickr

 http://www.flickr.com/photos/_bifi_/

 

14/05/2007 21:37 #. No hay comentarios. Comentar.

13/05/2007

¿Cosas para el fin de esta fase?

Quedan unos pocos dias de calculo para equilibrar el numero de trayectorias calculadas de cada tipo, y luego el proyecto quedara seguramente al ralenti a la espera de mas codigo que correr. Tambien la dedicacion al blog sufrira este ralenti, pero todavia hay unos dias para hacer cosas. Quizas podriamos sacar algun listado de potencia por marcas, a ver a igualdad de OS como queda el comparar Intel contra AMD. Quizas podriamos lanzar un Linpack en modo BOINC autentico, para comparar potencias teoricas y reales.

Actualizacion: de momento, vamos redondeando D0 y D1, que tienen tan solo unas 141898 trayectorias cada una, un orden de magnitud menos que las famosas A0 y A1, y la mitad todavia de las C0 y C1.

Mas actualizacion (16 de Mayo): llevamos  168763 D1,  y la idea es acercarnos lo mas posible a las C1, que son 263195, o a lo que quepa en el disco (que esta al 90% pero es de los grandes), asi que seguira corriendo al menos hasta el viernes y cerraremos jobs en algun momento del fin de semana, dejandolo encendido para que lleguen los retrasados (ahora esta a dos dias de tiempo). Hay que tener en cuenta que la velocidad de recogida actual es pausada, un poco mas de 10 trayectorias D1 por minuto.

13/05/2007 20:52 #. Hay 3 comentarios.

09/05/2007

El proceso de premios

Como ya hemos activado Zivis, en la pagina de estadisticas podeis ver clasificaciones a 11:00 am. Tened en cuenta que hay un proceso de eliminar repetidos y no participantes, asi que la lista definitiva saldra por la tarde en otro documento, a falta del premiado via sorteo.

La lista esta medio construida en http://zivis.bifi.unizar.es/premiados.html. Actualizacion: No han hecho falta mas suplentes, Beatriz ya ha construido la lista y ha llamado a todos los premiados, pero como el mantenedor de la web ha estado todo el dia de un lado para otro con recados varios no ha podido actualizarla en la web. Se publicaran los nombres, apellidos y regalo de todos los clasificados no tanto porque haga falta (ya estan contactados por telefono) sino porque el proceso es publico y hay una entrega publica.

A los premiados individuales se les va a pedir 1) identificacion 2) forma de contacto y 3) que nos envien por email una lista de su orden de preferencia de todos los regalos de la bolsa de premios (la que esta en premios.html) de manera que no tengamos que estar recontactando a todos en cada deslizamiento que se produzca.

Actualizacion. Ya se ha producido el sorteo de la ONCE. Asi que el afortunado de categoria C y los dos primeros suplentes serian:

Ganador: Numero: 75438 Participante: 820 puturru

Suplente 1, Numero 05647 : Participante : 62 Horsu

Suplente 2, Numero 22035 : Participante : 240 iber

Actualizacion: seguimos sin localizar a unos cuantos participantes de la parte media de la tabla. Si alguien los conoce, que les avise porque el tiempo se les acaba el viernes a las 11:00 am.

Son: puturru turbo DURAN ARA thanis schamann jmfg josemimf Francisco entropia437 2769485

09/05/2007 13:22 #. Hay 17 comentarios.

08/05/2007

ABCD: Objetivo del estudio

De la parte cientifica viene una explicacion mas detallada de A B C D:

Estamos tratando de estudiar varios aspectos del confinamiento para diferentes tipos de plasmas que se pueden crear en TJ-II. Están caracterizados por diferentes perfiles de densidad, temperatura y campo eléctrico. La observación más directa que se puede hacer es medir el tiempo de confinamiento, es decir, el tiempo promedio que un ión permanece dando vueltas a TJ-II antes de escapar por efecto de las derivas. Un paso más consistiría en estudiar más en detalle cómo se produce este fenómeno de transporte: estudiar cómo son los flujos de iones en el interior de TJ-II. También una información relevante, de la cual se puede extraer el máximo partido mediante nuestro visualizador 3d, es dónde chocan los iones con la cámara de vacío de TJ-II.

Los plasmas A y B son del tipo ECH (electron-ciclotron resonance). En ellos, los electrones que forman parte del plasma son calentados mediante un haz de radiación microondas. De este modo, se consigue una temperatura electrónica alta. Estos electrones a su vez están en contínuo contacto con los iones, y al colisionar con ellos, les comunican parte de su energía. De este modo se consigue aumentar la temperatura de los iones, o temperatura iónica. Como la densidad de este plasma es pequeña, estas colisiones ión-electrón no son muy frecuentes, y los iones no se calientan demasiado.

El plasma C es de mayor densidad. A estas densidades, la radiación penetra poco en el plasma, de modo que el calentamiento por ECH no es eficiente, y se complementa con inyección de neutros (NBI, neutran beam inyection). El procedimiento consiste en lanzar átomos neutros a gran energía al interior del plasma, estos átomos colisionan con iones del interior y les comunican parte de su energía. De este modo, la velocidad media de los iones, y por tanto la temperatura iónica, aumenta. La temperatura electrónica, por el contrario, será baja.

En estos dos casos, el potencial eléctrico en el interior presenta un mínimo en una región intermedia del plasma. Esto hace que el campo eléctrico frene en parte los iones que están saliendo del plasma por efecto de las derivas,
lo cual contribuye a mejorar el confinamiento. Este campo eléctrico que se mide en TJ-II es el creado por el conjunto de iones y electrones en del plasma

El plasma D es todavía de mayor densidad. Para esa densidad de partículas, el calentamiento por ECH no es posible, así que se realiza todo mediante NBI. En consecuencia, la temperatura electrónica será la más baja de los tres casos. En este plasma, el campo eléctrico apunta siempre en la dirección del punto más interno.

08/05/2007 21:05 #. No hay comentarios. Comentar.

07/05/2007

Sorteo posicion

De acuerdo al reglamento la tercera plaza del concurso se asigna al azar entre aquellos participantes que hayan aportado al menos 10 creditos. Esto implica que necesitamos un metodo para, partiendo de una semilla aleatoria publicamente verificada, elegir un participante entre aquellos que estando numerados en la primera columna de la lista individual esten tambien por encima de 10 creditos (por cierto si alguien no se encuentra en la lista o no tiene numero y deberia tenerlo solo puede ser porque se ha registrado incorrectamente; nos tendria que avisar por email rapidamente antes de mediodia de este lunes). La semilla publica mas obvia es el sorteo de la ONCE que son 100 000 posibilidades y hay que repartirlas equitativamente entre los mil y pico participantes listados.


El metodo de reparto equitativo es asignar "cupones virtuales" del sorteo, el mismo numero a todos los participantes. Si tenemos x participantes, podemos repartir n=trunc(100000/x) "cupones". Asi, al participante numero 1 de la lista le corresponden los cupones 0 a n-1 al participante numero 2 los cupones n hasta 2n-1, al numero 3 los cupones 2n hasta 3n-1 y asi sucesivamente hasta que al participante x le corresponen los cupones (x-1)n hasta xn-1.


El sistema tiene dos problemas, que son en realidad el mismo: por un lado, sobran los "cupones" del x * trunc ( 100 000 /x) hasta el 99999, y por otro el premio puede recaer en un jugador no valido. En tal caso, se anunciaria la circunstancia y se recurriria a una nueva semilla aleatoria: la del sorteo anterior. Y asi sucesivamente.Este sistema da exactamente la misma probabilidad de victoria a todos los participantes. Pongamos un ejemplo para aclararlo:
Supongamos que disponemos de 1824 participantes en el sorteo.
Entonces trunc(100000/1824) = 54
De modo que cada usuario recibe 54 numeros:
El primero de la lista, tendra del 0 al 53, el 2 del 54 al 107, hasta el
ultimo, el 1824 que recibe del 98442 98495.
De este modo si el numero premiado en la Once esta entre el 0 y el 53
el premiado seria el numero uno de la lista, si sale entre el 54 y el 107,
el segundo, etc.
Si el numero premiado estuviera entre el 98496 al 99999 (ambos inclusive),
habria que recurrir al premiado en el sorteo anterior, y asi sucesivamente.

El proceso sera de esta manera: el 9 de mayo a las 11 a.m. se detendra aproximadamente una hora la recepcion de resultados de zivis congelando asi los resultados. Estos se copiaran a una version estatica que sustituira a la estadistica dinamica, tras lo cual Zivis rearrancada para seguir produciendo resultados incluso en directo durante el viernes y el sabado.

De esta copia ya estatica se tomara el numero de participantes con mas de 10 creditos y se empleara el programa en C que se muestra en este enlace para determinar el ganador de la categoria C. La semilla aleatoria sera el resultado del sorteo de la ONCE del mismo miercoles 9 de mayo. En caso de que resulte seleccionado un numero invalido, se anunciara la circunstancia y se empleara el mismo metodo tomando como semilla el resultado del sorteo anterior (entiendo que el del lunes 7 -actualizacion: no, el del martes 8, claro, y luego el del lunes 7) y asi sucesivamente hacia atras con los cuponesm supercupones y cuponazos listados en la pagina web de la ONCE, en http://www.once.es/home.cfm?opcion=2&sorteosa=ok , siempre usando como referencia la lista definitiva de participantes que hemos capturado el 9 de mayo.
07/05/2007 12:14 #. Hay 4 comentarios.

05/05/2007

Donando tiempo a otros servidores.

Este es un tema que no controlamos demasiado, pero a una semana del final oficial de esta fase de Zivis puede ser interesante hablar no solo de nuestro supercomputador sino del resto de los proyectos BOINC que corren por el mundo, de si funcionan o no, y de como suscribirse a ellos. La idea es que incluso si Zivis continua (ya veis en el programa de actos del sábado que hay una mesa de trabajo sobre este asunto) es posible que pase por fases de mas o menos demanda, como le pasa por ejemplo a LHC@home. Y siempre esta el asunto de tener algo que calcular cuando hay un atasco como el de ayer; de hecho hemos notado que las maquinas que estan en varios proyectos internacionales parece que reaccionaron mas rapido a la hora de reconectar. Por otro lado una maquina que esta en varios proyectos aporta menos a Zivis. Egoistamente prefeririamos que los "locales" tuvieran un setup de 1000% en el "Resource Share" de las "Zivis Preferences" (aqui ).

Los primeros lugares para empezar a mirar otros proyectos a los que unirse son los webs de estadisticas, por ejemplo http://www.boincstats.com/ A partir de alli una buena pista es http://canalboinc.com que incluso tiene en sus foros un ranking de otros teams hispanos.

Quizas los miembros de teams hispanos podrian hacer un poco de propaganda aqui acerca de como unirse a su team y por qué. O quizas podriamos empezar creando un team "[zivis]" (o "[I survived Zivis]" Laughing) para todos los que se agregaran a otros proyectos y no esten adscritos a ningun team.

05/05/2007 22:16 #. Hay 5 comentarios.

04/05/2007

¡Tropezon de ultima hora!

20070504231538-cortado155.210.4.17-day.png

[04/May/2007:13:48:15 +0200] es la fecha que marca la ultima conexion apache. A las cinco entro a mi turno de tarde y ¡horror! no hay conexion, y la hora es la sospechosa de que algun operario en algun sitio haya dado "off" a un interruptor y se haya ido de fin de semana.

En media hora ya nos hemos convencido de que el error esta en el sistema que enlaza Zivis con la universidad, y que es un link de fibra optica adelantado por Telefonica para el proyecto (un equipamiento ya previsto para la universidad y que nos ha venido muy bien hasta ahora) y unos switches administrados por el SICUZ. Usease que somos tres entidades. Para mi sorpresa todos han reaccionado bien, pero aun asi no hemos encontrado la averia. Nuestros contactos en telefonica han llamado a un tecnico para que midiera los enlaces de fibra a la busqueda de algun corte, y el operador de guardia del SICUZ ha revisado su parte y ha esperado hasta las nueve de la noche a que Telefonica dictaminara (El mayor retraso ha sido conseguir aparcar la furgoneta de Telefonica en Corona de Aragon a las siete y media de un viernes). Pero no hemos encontrado averia en las lineas y no hemos encontrado ningun fallo de configuracion de los equipos (ni nadie que los estuviera manipulando a las dos menos cinco). Y el cable parecia recibir la señal laser tanto de ida como de vuelta, pero indicaba que la transmision estaba caida.

Asi que al final hemos tenido que admitir derrota y pasar al plan de backup, y esperar al lunes para ver si hay fallo de hardware en alguna parte de la ruta. El plan de emergencia es un link inalambrico en vez de uno de fibra, asi que nos quedamos limitados no se si  a 54 Mbits/s o a 27 Mbits/s de entrada de datos y, para felicidad de los sufridores de ADSL, no nos podemos permitir experimentar mucho mas con nuestros superficheros. Sobre todo si tras el fin de semana hay que repartir ese ancho con los usuarios/investigadores del BIFI, que tambien querran poder navegar y leer el email.

El link de emergencia utiliza diferentes IPs, asi que aunque a las nueve y media habiamos levantado ya el sistema, la propagacion del cambio puede haber tardado hasta un par de horas, dependiendo del proveedor de servicio. Afortunadamente hoy en dia ya muy pocos proveedores mantienen caches de IP demasiado largas (con eso del comercio electronico un envenenamiento de DNS puede salir caro).

No ha sido un alarde de rapidez Embarassed: 3 horas para darnos cuenta (las de la comida) y 4 horas para arreglarlo. Podriamos haber saltado al plan de backup en una hora, claro, pero si hubiera resultado que un click en algun sitio bastaba para arreglarlo habria habido dos cambios consecutivos del registro de DNS, o habriamos tenido que hacer y deshacer rutas provisionales. Asi que hemos alargado lo mas que hemos podido la decision hasta que todo lo que se podia verificar habia sido verificado. Insisto, hay que agradecer la reaccion y paciencia de nuestras contrapartes, tanto Telefonica como Servicio de Comunicaciones de la Universidad.

En la imagen se ve como ha ido el ancho de banda en las ultimas horas hasta el momento del corte. Ayer pausamos por la noche el envio de datos graficos, por si acaso, y lo habiamos vuelto a arrancar por la mañana.

Resumen: en principio, esta todo arriba y funcionando. Las IP de los servidores han cambiado, asi que algunos proveedores tardaran en borrar la cache y encontrar las nuevas IP, o quizas pasa lo mismo en la cache local. En cualquier caso en algun momento de la noche esto caducara y las maquinas volveran a encontrarnos. Algunas ya nos encuentran, asi que por nuestro lado creemos que esta bien.

04/05/2007 23:03 #. Hay 61 comentarios.

Para equilibrar el trabajo

Nos sugiere un participante que una forma de equilibrar el trabajo ahora que hay tareas muy dispares (poco/mucho ancho de banda, en particular) es solicitar mas trabajos de golpe. Esto es mediante una preferencia general de usuario, en
http://zivis.bifi.unizar.es/prefs.php?subset=global
llamada "Connect to network about every"... y que determina cuantos segundos de trabajo se piden al servidor; hay tambien un maximo de trabajos que se mandan, eso lo controlamos nosotros para todo el proyecto, asi que por mucho que lo subais no recibireis mas de 9 trabajos en una tanda. Pongamos que esos nueve son cinco de los de media hora y cuatro de los de cinco minutos... un intervalo de dos horas y media seria entonces razonable, y ese es el 0.1 dias que se suele sugerir en los defaults. Si teneis una maquina mas lenta, podeis subir el intervalo, pero si lo subis demasiado nos arriesgamos a que el cliente pase un tiempo sin trabajo para ejecutar.

El caso es que este truco permite asegurarse de que seguimos calculando mientras se produce el upload de los ficheros grandes de 250 MB. Pero claro, podria tener el inconveniente de requerir demasiado espacio en disco si se reciben dos o tres de los trabajos que generan estos ficheros.

04/05/2007 13:16 #. Hay 2 comentarios.

03/05/2007

Entradas del Teatro Romano

20070503111131-tiendainterior2.jpg

Hemos mandado un email para recordar que la entrada del teatro romano hay que recogerla anticipadamente. Los de PlanetPC se han ofrecido voluntarios para hacer el reparto; si no habeis recibido el email eso es que no estais en la lista, y si no estais en la lista eso es que no os habeis identificado correctamente en el blog municipal. Y si os identificais ahora, se pierden los creditos de fase de concurso (lo cual no es grave si no estais compitiendo, claro) y de todas formas ya hemos bajado el listado a la tienda. Asi que si pensais venir y no os hemos mandado un email ni estais en la lista de PlanetPC escribidnos a zivis@unizar.es y veremos que se puede hacer.

Hay que reservar un tramo horario, por eso del aforo. El programa estara disponible en la web municipal.

Los premios estan expuestos en la tienda, pero os recuerdo que estaban tambien listados en http://zivis.bifi.unizar.es/premios.html .

03/05/2007 11:11 #. No hay comentarios. Comentar.

02/05/2007

flickr group pool and tags

El paron de comunicaciones del jueves puede ser una oportunidad para que la gente intente encontrar y copiar sus ficheros *_5 y visualizarlos. A tal fin hemos creado un grupo en Flickr:

http://www.flickr.com/groups/boinczivis/pool/

y tambien las tags BOINC zivis, usease

http://www.flickr.com/photos/tags/boinc+zivis/

pero no se por que esto no es instantaneo, en cambio añadirse al grupo y luego enviar las imagenes al grupo resulta casi automatico

Si alguien obtiene una imagen interesante y no tiene cuenta en Flickr, tambien nos la puede mandar directamente a zivis@ unizar es con el subject "foto para el blog" o similar, y nosotros mismos podemos subirla.

Es recomendable experimentar con C0 y no con C1, porque las de C1 son muy grandes. En el caso de caer en la tentacion, siempre se puede truncar el fichero original o el output del od, usando las instrucciones head y tail de unix, o cosas asi.

02/05/2007 22:33 #. Hay 15 comentarios.

Otra parada, esta vez de la universidad

Ha llegado el siguiente email, y como estamos en veinte ajos a la vez no hemos llegado a contactar con el SICUZ a ver en que nos afectaba y cuanto tiempo:

From: "Pedro Pardos Alda" 
To: ,
Date: Fri, 27 Apr 2007 13:39:46 +0200

 Vuelvo a dirigirme a ti para recordarte que el próximo jueves  3 de mayo está previsto parar  todas las máquinas instaladas en el Centro de Proceso de Datos del SICUZ.

Ello significa que se interrumpirán la gran mayoría de los servicios informáticos y de comunicaciones incluyendo el acceso a internet, todos los servicios de gestión universitaria, el correo electrónico, los servidores de páginas web o los servidores de ficheros e impresión. Se intentará mantener la continuidad del sistema telefónico global de la Universidad pero pudiera haber algún corte, en especial en la comunicación entre centrales y en el acceso al exterior de la Universidad.

La máquinas comenzarán a pararse a las 7:00 horas y esperamos haber recuperado la normalidad aproximadamente a las 12:00 horas.

El motivo de esta interrupción del servicio es realizar modificaciones en la instalación eléctrica del CPD que posibiliten la conexión de los servidores recientemente adquiridos a la vez que se mejora dicha instalación dotándola de mayor seguridad y fiabilidad. Lamentamos las molestias que esta interrupción pueda ocasionar pero, por un lado es inevitable apagar todas las máquinas para modificar la instalación eléctrica y, por otro, es complejo encontrar un momento de mínimo impacto habiendo que coordinar las actuaciones de todas las personas que pueden llegar a intervenir (personal propio, de la UTC, de empresas suministradoras, de RedIRIS, etc.) así como de las aplicaciones informáticas sometidas a plazos de ejecución inalterables (como por ejemplo la nómina)

Reciba un cordial saludo

02/05/2007 20:27 #. No hay comentarios. Comentar.

30/04/2007

beta work para ancho de banda alto

Las tareas C1 + fichero , cuyas trayectorias ocupan unos 250 megabytes, las vamos a mandar como "beta_work". Lo vamos a activar solamente para los que tengan conexiones bastante rapidas, un centenar de participantes que segun la base de datos nos ha enviado promedios de upload por encima de los 0.3 mbits. No obstante aquellos que piensen que no van a tener suficiente ancho de banda pueden desconectarlo desde la pagina de opciones, http://zivis.bifi.unizar.es/Zivis/prefs.php?subset=project , donde dice "Run test applications". Y por supuesto al reves, si pensais que podeis aguantar el tiron, activad la opcion. Mañana lanzaremos otra tanda a ver que tal asi.
30/04/2007 16:54 #. Hay 5 comentarios.

plot de una trayectoria

20070430140200-gnuplot.jpg

El primer paso para ver una trayectoria es encontrar un fichero lgv3t_conTr_C0_xxxxx_5 que este terminado pero no lo hayais mandado aun. Un truco es detener comunicaciones mientras se enreda con esto para asegurarse que el fichero no lo acaba enviando boinc y lo perdemos a mitad del juego.

El segundo paso es conseguir que el formato pase a ser ascii. El fichero es una secuencia de vectores (X,Y,Z,v) en floats (de 4 bytes, por tanto 16 bytes por dato) y ademas tiene un vector cero cada 1000 pasos. Un truco en unix, aprovechando que la linea es de 16 bytes, es usar directamente od -An -tf4 lgv3t_conTr_C0_30-06-27-15-84_0_5 | grep -v 0.000 Ya lo siento Razorblade, pero desde windows tendreis que buscaros algun otro comando o escribir un programita de pasar binario a texto.

El fichero texto producido se puede poner directamente en gnuplot. De hecho en unix no se necesita ni usar un fichero de texto intermedio. Podemos llamar a gnuplot y dar por ejemplo la orden

gnuplot> splot ’< od -An -tf4 resultados/lgv3t_conTr_C0_30-06-27-15-84_0_5 | grep -v 0.000’ using 1:2:3

y esa linea hace todo el trabajo! Ademas, es posible rotar la imagen con el raton.

30/04/2007 14:02 #. Hay 6 comentarios.

tareas "conTr"

    Estamos  lanzando un pequeño batch de tareas con dibujo completo de la trayectoria (no en el salvapantallas, sino en disco duro) a ver como reaccionan los equipos. Eso significara un aumento apreciable del uso de disco duro y un aumento apreciable tambien, sospechamos, del uso de ancho de banda de upload. A los que necesitan ese ancho de banda les puede convenir ajustar las preferencias en las paginas web de configuracion (no en las del ayuntamiento, sino en las de zivis.bifi.unizar.es).

De momento ya hemos visto que las trayectorias mas largas no tenian suficiente disco duro asi que habra un par de RESOURCE LIMIT EXCEEDED o algo asi en los logs.

Por cierto el fichero que se crea en disco se puede visualizar con el GNU Plot. Luego mas tarde os lo contamos, si quereis. 

 

30/04/2007 01:52 #. Hay 9 comentarios.

27/04/2007

cazando el bug de validacion

El crash de esta madrugada ha sido un asunto interno nuestro, tan solo agravado un poco por la velocidad de respuesta. El validador nuevo se quedaba calado y aunque el cron lo relanza cada cinco minutos eso solo servia para revisar unas pocas workunits antes de cascar de nuevo. El motivo: un acceso a puntero nulo.

Fragmento de codigo:

retval = get_output_file_paths(result, output_file_names);
int noutputs = output_file_names.size();
fprintf(stderr, "Hay %d outputsn",noutputs);

fprintf(stderr, "Accedo al primer fichero---------------------------n");
if (retval) return retval;
fprintf(stderr, "Accediendo al fichero %sn",output_file_names[0].c_str());
... = try_fopen(output_file_names[0].c_str(), f, "r");

¿Lo veis? cuando no hay ficheros en el resultado, retval no devuelve error, y simplemente noutputs vale 0. Pero claro, como solo nos preocupamos de retval nos vamos a la lineas siguientes y voila, intentamos leer un campo de output_file_names[0], que por supuesto no existe. De hecho, el sistema se queda colgado antes de try_fopen, en el fprintf del log.

Luego un poco mas adelante el problema se repite, cuando analizamos el siquiente fichero de la respuesta sin asegurarnos de que noutputs > 1:

fprintf(stderr, "Accediendo al fichero %sn",output_file_names[1].c_str());
retval = try_fopen(output_file_names[1].c_str(), f2, "r");

El problema de fondo ha sido que en el diseño de este nuevo validator ya nos conociamos BOINC lo suficiente, creiamos, para estar seguros de que si todos los ficheros obligatorios no estaban presentes el resultado nunca seria "Success" y por tanto no entraria ni siquiera a validacion. Y hemos visto ahora que no, que en algunos casos (un centenar teniamos ahora en la base de datos) se nos entrega solo un fichero o ninguno, con los datos incompletos, y que a pesar de eso el client state afirma ser "Success". Por cierto que estos casos tienen una pequeña interseccion con otros de los que se quejaba J, aquellos de CPU cero o muy corta. Asi que en quitando el bug y verificando no solo la existencia del primer fichero sino tambien de los restantes es bastante posible que estemos matando dos pajaros de un tiro.


27/04/2007 18:29 #. Hay 3 comentarios.

Crash

Con tanta maquina corriendo, y buena parte del equipo distraido en asuntos que no tenian que ver directamente con el mantenimiento del servidor (eso incluye tambien otros proyectos y unos cuantos centenares de kilometros de seminarios), ha pasado lo que tenia que pasar: se nos ha llenado /home esta noche. Asi que estamos recuperando del crash, pasando /home a otra particion mas grande y veremos de rearrancar en un rato. Cry
27/04/2007 10:02 #. Hay 8 comentarios.

26/04/2007

Disculpas por nuestra parte, y acuses de recibo varios.


Acusamos recibo de varias quejas, esta vez de la competicion por equipos (colectivos). Se quejan desde Hispalinux de la escasa explicación sobre el paron de ayer, en particular de que debido a su duracion la mayoria de los clientes BOINC bajaron su frecuencia de comunicaciones automaticas con el servidor y aunque no desconectaron del proyecto se quedaron virtualmente en pausa durante mas de 24 horas en algun caso. Quizas tendriamos que haber sido mas extensos en nuestra explicacion sobre los posibles efectos del paro, y nos disculpamos por no haber sido mas detallistas ni en el email semanal de notificacion ni aqui en el blog. En nuestra defensa, decir que el mecanismo es general del sistema boinc y no obedece a ninguna adaptacion especial de Zivis.
Tambien hay recibo de comentarios de los participantes del equipo AupaZaragoza.com, que se encuentran preocupados por las maquinas de la universidad que han pasado recientemente a sumarse en softwarelibre_zgz y queremos de antemano pedir disculpas por nuestra escasa capacidad de maniobra respecto a estas operaciones. Al respecto, el reglamento que nos autoimpusimos -publicado tres dias antes de comenzar el concurso- dice que "Para la participacion individual no se consideraran los creditos recibidos desde ordenadores situados en las instituciones organizadoras. Por otra parte, y dado que estas instituciones promueven el asociacionismo en algunos ambitos, sí que se contabilizaran para la participacion colectiva". Pero no nos hemos dotado de herramientas para hilar mucho fino en la cuestion de cuando se esta promoviendo el asociacionismo; lo unico que hemos aclarado, y anunciado en un post anterior, que las Facultades y Escuelas como tales no forman asociaciones y no participan de los premios para colectivos. Nos gustaria --y sabemos que al final ocurrirá asi-- que se impusiera un cierto sentido etico en cada participante, acerca de en qué manera se esta integrando un colectivo y del por qué. Por ejemplo, no parece adecuado que softwarelibre_zgz acumule puntos a partir de sistemas operativos propietarios, por mucho que los managers de estos sistemas hayan querido asi manifestar su apoyo al software libre; más bien desvirtua el proposito del grupo. Nosotros mismos en Zivis hemos hecho un esfuerzo para no depender de software propietario ni siquiera en el desarrollo de las aplicaciones Windows (usamos compilacion cruzada desde Linux).

En cualquier caso, y para que esten las cosas visibles para todos, la pagina web
http://zivis.bifi.unizar.es/ranking/full.php
tiene ahora una tercera seccion en la que se listan las maquinas que, aunque excluidas de lo individual, podrian estar o estan participando en colectivos.

Ya que hemos ojeado el reglamento, convendria subrayar algun detalle que puede ser fuente de complicacion. La puntuacion de un colectivo se juzga y suma "al final de la fase de concurso". Lo que significa que al igual que los cambios de adscripcion han traido puntos a los colectivos, estos puntos pueden restarse mediante el simple procedimiento de abandonar la adscripcion. Por supuesto, en el caso de participantes que tambien tengan derecho a aparecer en los listados individuales, ese abandono a partir de ahora (de mañana 27 a las 11 para ser concretos) les supondra tambien la penalizacion de perder la puntuacion individual acumulada. Notad ademas que en general a partir de mañana consideraremos cualquier cambio en la pagina de datos personales un "cambio de usuario", a no ser que sea evidente que se trata de una correccion de erratas y en este caso se nos tendra que notificar de antemano; esto afecta tambien a un punto de la normativa individual: el ajuste a cero de los ordenadores que "cambian de usuario".
26/04/2007 21:50 #. Tema: concurso. Hay 40 comentarios.
BIFI - CIEMAT - Ay. de Zaragoza / © Ayuntamiento de Zaragoza / webmunicipal@zaragoza.es / Mapa Web / Miembro W3c / XHTML 1.0 / CSS 2.0 / Accesibilidad
| Blog ciudadano realizado con Blogia 2.0 | Suscríbete: RSS | Administrar