HTTrack Website Copier – Descarga sitios web completos para navegar sin conexión
Descripción del programa HTTrack Website Copier
HTTrack Website Copier es un navegador offline gratuito y de código abierto que permite descargar sitios web completos desde Internet a un directorio local. Desarrollado por Xavier Roche y otros colaboradores, este programa construye recursivamente todas las directorios del sitio, obteniendo archivos HTML, imágenes, hojas de estilo, scripts y otros recursos desde el servidor.
Una vez descargado, puedes navegar por el sitio espejo en tu ordenador como si estuvieras conectado a Internet, abriendo las páginas en tu navegador habitual.
Cabe destacar que su principal ventaja es la capacidad de mantener la estructura de enlaces relativa del sitio original. HTTrack no solo descarga los archivos, sino que también reescribe los enlaces internos para que funcionen correctamente en tu disco duro. Esto significa que puedes hacer clic de una página a otra exactamente igual que si estuvieras navegando online.
El programa también puede actualizar sitios ya descargados y reanudar descargas interrumpidas, lo que resulta muy útil para sitios grandes que pueden tardar horas en completarse.
El desarrollo de HTTrack comenzó a finales de la década de 1990 y se ha mantenido activo hasta la actualidad. La versión más reciente es la 3.49.6, publicada en marzo de 2025, lo que demuestra que el proyecto sigue recibiendo mantenimiento activo.
HTTrack está disponible en dos versiones principales: WinHTTrack para sistemas Windows (con interfaz gráfica) y WebHTTrack para sistemas Linux/Unix/BSD (versión de línea de comandos). El programa está licenciado bajo GPL, lo que garantiza su libertad de uso y modificación.
¿Necesitas guardar una página web para consultarla sin conexión, respaldar un sitio completo o crear una copia local de documentación técnica?
Características clave de HTTrack Website Copier
1. Descarga completa de sitios web
La funcionalidad principal de HTTrack es la capacidad de descargar sitios web enteros de forma recursiva. El programa sigue todos los enlaces internos del sitio y descarga automáticamente todos los archivos necesarios: páginas HTML, imágenes, archivos CSS, JavaScript, vídeos y otros recursos. Puedes elegir entre descargar el sitio completo o limitarte a ciertas secciones mediante filtros.
2. Estructura de enlaces adaptada para navegación offline
HTTrack reescribe automáticamente los enlaces internos del sitio para que funcionen correctamente en tu ordenador. Los enlaces absolutos se convierten en relativos, y los recursos externos (como imágenes alojadas en otros dominios) se pueden excluir o descargar según tu configuración. El resultado es un espejo funcional del sitio que puedes explorar en cualquier navegador sin necesidad de conexión.
3. Actualización incremental y reanudación de descargas
Una de las características más útiles de HTTrack es la capacidad de actualizar sitios ya descargados. En lugar de volver a descargar todo desde cero, el programa compara el sitio local con la versión online y solo descarga los archivos nuevos o modificados. También puedes reanudar descargas interrumpidas, lo que es esencial para sitios grandes donde una conexión inestable podría interrumpir el proceso.
4. Filtros avanzados de contenido
HTTrack incluye un potente sistema de filtros que te permite controlar con precisión qué archivos se descargan y cuáles se omiten. Puedes filtrar por tipo de archivo (por ejemplo, excluir vídeos o archivos ZIP), por dominio (solo descargar enlaces internos, no externos), por tamaño máximo de archivo o por expresiones regulares personalizadas. Esto te permite optimizar la descarga para ahorrar tiempo y espacio en disco.
5. Interfaz gráfica y línea de comandos
HTTrack ofrece dos modos de uso. WinHTTrack es la versión con interfaz gráfica para Windows, que presenta un asistente paso a paso que guía al usuario en la configuración de la descarga. WebHTTrack es la versión para sistemas Unix/Linux que se ejecuta desde la terminal, ideal para automatizar descargas mediante scripts o para servidores sin entorno gráfico.
Explicación detallada de las funcionalidades
El funcionamiento de HTTrack se basa en un algoritmo de rastreo recursivo similar al de los motores de búsqueda. Cuando inicias una descarga, el programa comienza con la URL que has proporcionado, descarga la página principal y luego analiza todo su contenido HTML en busca de enlaces a otras páginas, imágenes, hojas de estilo y otros recursos. Cada nuevo enlace encontrado se añade a una cola de descarga, y el proceso se repite hasta que se alcanza la profundidad máxima configurada o hasta que no quedan más enlaces dentro del sitio.
El programa distingue automáticamente entre enlaces internos (que pertenecen al mismo sitio web) y enlaces externos (que apuntan a otros dominios). Por defecto, HTTrack solo descarga enlaces internos, manteniendo el espejo dentro del dominio original, mientras que los enlaces externos se convierten en enlaces funcionales que apuntan al sitio original online. Esto evita descargar contenido de otros sitios que no te interesan y ahorra ancho de banda.
Para sitios grandes o con muchas imágenes, HTTrack ofrece opciones para limitar el ancho de banda utilizado y el número de conexiones simultáneas. El parámetro -cN controla cuántas conexiones paralelas se abren al mismo tiempo (por defecto 8), mientras que -AN limita la velocidad de transferencia en bytes por segundo. Estas opciones son especialmente útiles para no saturar el servidor del sitio que estás descargando o para no consumir todo el ancho de banda de tu conexión.
Descarga e instalación de HTTrack Website Copier
- Página oficial: www.httrack.com
- Versión actual: 3.49.6 (marzo de 2025)
- Últimas versiones: 3.49.6 (2025), 3.49.5 (2024), 3.49.4 (2023), 3.49.2 (2021)
- Tamaño: Aproximadamente 5-8 MB (instalador)
- Sistemas operativos compatibles: Windows (desde 2000 hasta 11), Linux, Unix, BSD, macOS
- Requisitos mínimos: Procesador 1 GHz, 128 MB RAM, 20 MB espacio en disco (más espacio para los sitios descargados)
- Licencia: GNU General Public License (código abierto, completamente gratuito)
- Idiomas: Múltiples idiomas incluyendo español, inglés, francés, alemán, chino, japonés
- Soporte técnico: Foros en la web oficial, documentación HTML incluida, lista de correo
Cómo usar HTTrack Website Copier
Cuando ejecutes WinHTTrack por primera vez, se abrirá un asistente que te guiará a través de tres pasos principales. En el primer paso, debes asignar un nombre a tu proyecto y elegir la carpeta donde se guardarán los archivos descargados. Es recomendable usar nombres descriptivos para identificar fácilmente cada sitio descargado. También puedes optar por añadir el proyecto a una categoría para organizar múltiples descargas.
En el segundo paso, introduces la URL del sitio web que quieres descargar. Puedes añadir varias URLs si quieres descargar varios sitios en el mismo proyecto. El asistente te ofrece un botón Acción con opciones preconfiguradas: Descargar sitio(s) web, Descargar sitios web y sus enlaces externos, Actualizar sitio web existente y otras. Para la mayoría de los casos, la opción por defecto es suficiente. También puedes especificar filtros en este paso, como «+.gif –.zip» para descargar GIFs pero excluir archivos ZIP.
En el tercer paso, accedes a las opciones avanzadas. Aquí puedes configurar la profundidad de rastreo (cuántos niveles de enlaces seguir), el número de conexiones simultáneas, la limitación de velocidad y qué tipos de archivos excluir. También puedes indicar si quieres que HTTrack respete el archivo robots.txt del sitio (recomendado por cortesía) y si debe intentar descargar archivos de gran tamaño o solo páginas HTML. Una vez configurado todo, haz clic en Siguiente y la descarga comenzará.
Durante la descarga, la interfaz muestra estadísticas en tiempo real: número de archivos descargados, enlaces analizados, bytes transferidos y tiempo restante estimado. Puedes pausar y reanudar la descarga en cualquier momento. Cuando termine, puedes hacer clic en el botón Explorar el sitio espejo para abrir la página principal del sitio descargado en tu navegador predeterminado y empezar a navegar sin conexión.
Observaciones sobre el programa HTTrack Website Copier
Frente a otras herramientas de descarga como Wget (similar pero solo línea de comandos) o herramientas propietarias, HTTrack destaca por su interfaz gráfica intuitiva y su facilidad de uso para principiantes.
Mientras que Wget requiere memorizar parámetros complejos como --mirror --convert-links, WinHTTrack presenta un asistente paso a paso que hace que la configuración sea accesible para cualquier usuario. Para profesionales y usuarios de servidores, la versión de línea de comandos ofrece la misma potencia en un entorno scriptable.
En términos prácticos, el mayor beneficio para el usuario final es la posibilidad de acceder a contenido web sin conexión. Para estudiantes que necesitan consultar documentación técnica en lugares sin WiFi, para viajeros que quieren llevar guías de viaje en su portátil, o para investigadores que archivan fuentes web, HTTrack es una herramienta invaluable. También es muy útil para crear copias de seguridad de sitios web propios o para migrar contenido de un hosting a otro.
El desarrollador, Xavier Roche, ha mantenido el proyecto durante más de 25 años, con la primera versión publicada a finales de los 90. HTTrack está escrito en lenguaje C y cuenta con una comunidad activa de contribuidores que ayudan con traducciones, informes de errores y desarrollo. El código fuente está disponible en GitHub bajo licencia GPL, lo que permite a cualquiera estudiarlo, modificarlo o distribuirlo libremente.
Las actualizaciones de HTTrack son regulares. La versión 3.49.6 se publicó en marzo de 2025, y las versiones anteriores (3.49.5, 3.49.4) se lanzaron en 2024 y 2023 respectivamente. Aunque las actualizaciones no son mensuales, el proyecto se mantiene activo con correcciones de errores y mejoras de compatibilidad con las nuevas tecnologías web.
Existe una versión portable de WinHTTrack que no requiere instalación y puede ejecutarse desde un pendrive. Se puede descargar desde la web oficial en formato ZIP. Simplemente descomprimes el archivo en una carpeta y ejecutas httrack.exe. La versión portable es ideal para técnicos o usuarios que trabajan en múltiples ordenadores sin permisos de administrador.
Entre las funcionalidades extra, cabe destacar que HTTrack puede generar archivos de índice (index.html) automáticamente para facilitar la navegación, y puede crear un archivo MIME completo (.mht) que encapsula todo el sitio en un solo archivo. También soporta cookies, autenticación básica, proxies y limitación de ancho de banda. Para usuarios avanzados, la opción -%P activa el análisis extendido de JavaScript, lo que permite capturar enlaces generados dinámicamente.
Limitaciones importantes
- ❌ Los sitios con contenido dinámico pesado (aplicaciones JavaScript complejas) pueden no descargarse completamente.
- ❌ Sitios muy grandes pueden requerir mucho espacio en disco y tiempo de descarga.
- ❌ Algunos servidores pueden bloquear descargas masivas o limitar la velocidad.
Alternativa recomendada
Si buscas una herramienta más ligera y disponible por defecto en sistemas Unix/Linux, puedes probar Wget con los parámetros de mirroring. El comando wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://ejemplo.com logra un resultado similar al de HTTrack, descargando un sitio completo y adaptando los enlaces para navegación offline.
Wget está preinstalado en la mayoría de distribuciones Linux y en macOS, y está disponible para Windows como parte de paquetes como Cygwin o MSYS2.
Wget tiene como principal ventaja que es ligero, está disponible por defecto en muchos sistemas y es fácil de automatizar mediante scripts. La desventaja es que no tiene interfaz gráfica y su configuración requiere memorizar parámetros de línea de comandos.
Para la mayoría de los usuarios domésticos con Windows, WinHTTrack es la opción más amigable. Para administradores de sistemas y usuarios de Linux que prefieren la línea de comandos, Wget es una alternativa perfectamente válida y a menudo más rápida.
Sección FAQ
¿HTTrack Website Copier es gratis o de pago?
HTTrack es completamente gratuito y de código abierto bajo la licencia GPL. No tiene versiones de pago ni funciones bloqueadas. Puedes usarlo libremente para cualquier propósito, personal o comercial, sin costo alguno.
¿Funciona en Windows, Mac y Linux?
Sí, HTTrack está disponible para Windows (WinHTTrack con interfaz gráfica) y para sistemas Unix/Linux/BSD (WebHTTrack en línea de comandos). Para macOS, puede ejecutarse a través de la versión para Unix o mediante emuladores como BlueStacks.
¿Qué diferencia a HTTrack de simplemente guardar una página web en el navegador?
La diferencia principal es que guardar una página en el navegador solo descarga la página actual y sus recursos inmediatos, pero no los enlaces a otras páginas. HTTrack descarga todo el sitio de forma recursiva, siguiendo todos los enlaces internos, y además reescribe los enlaces para que la navegación offline funcione perfectamente.
¿Puedo usar HTTrack para descargar sitios web con contraseña?
Sí, HTTrack soporta autenticación básica HTTP. Puedes introducir el nombre de usuario y contraseña en las opciones de proxy o directamente en la URL (por ejemplo, https://usuario:contraseña@ejemplo.com). También soporta cookies, por lo que puede funcionar con sitios que requieren inicio de sesión mediante formularios.
¿Por qué mi sitio descargado no se ve igual que el original?
Esto puede deberse a que el sitio utiliza tecnologías que HTTrack no puede capturar completamente, como aplicaciones JavaScript muy dinámicas (por ejemplo, frameworks como React o Angular con renderizado del lado del cliente), contenido cargado mediante AJAX después de la carga inicial, o fuentes web alojadas en CDNs externos excluidos de la descarga.
Para mejorar el resultado, prueba a aumentar la profundidad de rastreo (-rN), activar el análisis extendido de JavaScript (-%P), o incluir explícitamente los dominios de CDNs en los filtros.
