EDICIóN GENERAL
  1. Probando el notame desde edbrowse
  1. @anthk llevo tiempo dando vueltas a alguna forma de automatizar acciones en la web, y estaba considerando Selenium

    De las herramientas que conoces, ¿cuál te da menos problemas de compatibilidad? (javascript, cookies,...) ¿Cuál recomendarías para usar (por ejemplo) en un script de Python?
    1. @trylks Python con Mechanize y similares o Selenium, segun.
    2. @Apostolakis entonces debe ser lo mejor, probaré

      @anthk de la web de Mechanize:

      If you come across this in a page you want to automate, you have a few options. Here they are, roughly in order of simplicity: […] Third is to use some browser automation framework/library to scrape the site instead of using mechanize. These libraries typically drive a headless version of a full browser that can execute all JavaScript. They are typically much slower than using mechanize and far more resource intensive, but do work as a last resort.

      Nunca he entendido por qué en series y películas siempre dejan lo que realmente funciona para lo último, p.ej: Goku y kamehameha

      Así que voy a empezar por Selenium que creo que es lo que Mechanize menciona como último recurso, y lo que @Apostolakis y tú mismo recomendáis, lo que estaba considerando yo igualmente, y lo que es más raro que falle

      La escalabilidad no es problema porque la idea es pasar de manual a automático, malo será que el ordenador necesite más de un minuto para lo que yo necesito varios minutos…

      Espero que Selenium sea fácil, si no no me renta   media
    3. @trylks Lo gracioso es que edbrowse tambien automatiza, soporta un minimo de JS, y tambien sirve como cliente de correo.
      Utiliza una sintaxis similar a ed(1).

      Tambien puede usarse como cliente de BBDD.

      edbrowse.org/usersguide.html
  2. @trylks tengo un proyecto donde gran parte del chiringuito está montado en selenium, la otra parte tomamos los datos dirtectamente de las APIs de las páginas.
    mmm, no sabría decirte algo mejor, lo demás que usamos es para hacer scraping.


    @anthk

    menéame