Cómo encontrar y eliminar archivos duplicados en Linux

Desde hace unos días el servidor de archivos del Colegio me avisa de que se está quedando sin espacio para almacenar nuevos documentos. Este mismo problema aparece en algunos equipos donde los usuarios van haciendo copias sin control de muchos de los trabajos que utilizan a diario. En otras ocasiones duplican sobre su espacio personal los archivos públicos de otros usuarios que consideran importantes o interesantes en lugar de quedarse con la referencia al original.

buscar

Los archivos duplicados son un gasto innecesario de espacio en disco, espacio que no sólo utilizamos nosotros, también el sistema necesita ese recursos para funcionar. Después de todo , si  realmente necesitamos el mismo archivo en dos lugares diferentes siempre se puede establecer un enlace simbólico (como un acceso directo) o uno duro (duplicar la referencia al mismo contenido) manteniendo de esta manera una sola copia física en el disco .

Pero ¿cómo encuentro yo los duplicados entre la maraña de cientos de miles de carpetas y ficheros?

FSlint

FSlint está disponible en el Centro de software de Ubuntu.  Esta utilidad proporciona tanto una interfaz gráfica como una versión de comando de consola para utilizarla en terminal.

fslint

Por defecto, abre el panel de «Duplicados» seleccionado y con nuestro directorio personal como  ruta de búsqueda predeterminada . Todo lo que tienes que hacer es clic en el botón «Buscar» y FSlint encontrará una lista de archivos duplicados en los directorios bajo la carpeta de seleccionada . Utiliza los botones para borrar todos los archivos que deseas eliminar. Puedes hacer doble clic en ellos para obtener una vista previa antes de eliminarlos.

Nota: la versión de consola no está disponible para su invocación directa, por lo que tienes que «buscarlo» cuando quieras utilizarlo:

$ /usr/share/fslint/fslint/fslint  carpeta

fslincon

En este caso el comando se limita a mostrarnos los duplicados encontrados dejando el borrado o cualquier otra acción en manos del usuario.

fdupes

El comando fdupes tampoco no se instala por defecto, pero está disponible en los repositorios de muchas distribuciones de Linux . Posiblemente es la herramienta de línea de comandos más rápida que puedes utilizar si deseas encontrar archivos duplicados en un entorno donde sólo se tiene acceso a una línea de comandos de Linux y no a una interfaz gráfica de usuario.

Su uso es sencillo: ejecuta el comando fdupes  seguido de la ruta de acceso a un directorio. Añade la opción  -r para buscar de forma recursiva en todos los subdirectorios dentro del seleccionado.

fdupes

Esta herramienta no quita automáticamente los ficheros.  sólo te mostrará una lista de archivos duplicados . A continuación, puedes eliminar los archivos duplicados a mano . También puedes ejecutar el comando con la opción -d para que te ayude a borrarlos: te le pedirá que elijas los archivos que deseas conservar.

Artículo original: www.howtogeek.com