Todos los cursos > Informática ( TI ) > Mantenimiento de Computadora ::

Memoria RAM y almacenamiento: pruebas, errores y recuperación de arranque

Capítulo 5

Tiempo estimado de lectura: 10 minutos

+ Ejercicio

Síntomas típicos según el componente

Fallos asociados a memoria RAM

Pantallazos (BSOD) aleatorios con códigos variables (por ejemplo, MEMORY_MANAGEMENT, IRQL_NOT_LESS_OR_EQUAL, PAGE_FAULT_IN_NONPAGED_AREA), especialmente bajo carga o al reanudar de suspensión.
Reinicios sin patrón o cierres de aplicaciones con errores de “acceso a memoria”.
Corrupción de archivos tras descomprimir/instalar (checksums que no coinciden, instaladores que fallan).
Congelamientos que no dejan registro claro en el sistema.

Fallos asociados a almacenamiento (SSD/HDD)

Lentitud extrema repentina: tiempos de apertura muy altos, “100% de uso de disco” sostenido, microcortes al copiar.
Errores de lectura/escritura: archivos que desaparecen, carpetas corruptas, mensajes de “no se puede leer del dispositivo”.
Problemas de arranque: bucles de reparación, “no se encontró sistema operativo”, “inaccessible boot device”.
Ruidos mecánicos en HDD (clics repetidos) o desconexiones intermitentes (cable/puerto/energía).

Cómo diferenciar rápido RAM vs disco (pistas prácticas)

Si el problema aparece en tareas de CPU/RAM (compilar, render, juegos) y los errores son aleatorios, sospecha RAM/IMC (controlador de memoria).
Si el problema aparece en I/O (copiar, instalar, actualizar) y hay reintentos, congelamientos durante accesos a disco o eventos de “disk”, sospecha almacenamiento.
Si el sistema no arranca, prioriza rescate de datos y diagnóstico SMART antes de “reparar” el arranque.

Reseating y pruebas por módulos/canales (RAM)

Objetivo

El reseating y la prueba por módulos/canales buscan aislar si el fallo proviene de: un módulo específico, un zócalo (slot), un canal (A/B), o de parámetros de configuración (XMP/EXPO, voltaje, frecuencia).

Guía práctica: reseating y aislamiento

Apaga y desconecta el equipo. Descarga energía residual (botón de encendido 10–15 s con el equipo desconectado).
Retira los módulos y revisa: polvo, pestañas flojas, contactos con suciedad. Limpieza suave con aire y, si es necesario, alcohol isopropílico en paño sin pelusa (sin empapar).
Reinstala asegurando clic en ambos lados. Verifica que estén en los slots recomendados (por ejemplo A2/B2 en dual channel, según manual).
Prueba por módulo: arranca con un solo módulo en el slot primario recomendado. Repite con cada módulo.
Prueba por slot/canal: con un módulo “bueno”, prueba en distintos slots para detectar zócalo/canal defectuoso.
Registra resultados en una tabla para no mezclar variables.

Prueba	Módulo	Slot	Resultado	Notas
1	RAM #1	A2	OK/Fail	BSOD/No POST/Estable
2	RAM #2	A2	OK/Fail	…
3	RAM #1	B2	OK/Fail	…

Pruebas de memoria: qué usar y cómo interpretar

Windows Memory Diagnostic: útil como chequeo rápido, pero no es el más estricto. Úsalo para una primera señal, no como veredicto final.
MemTest86 (arranque USB): buena cobertura y reportes. Si aparecen errores, asume inestabilidad real (módulo, slot, IMC o parámetros).
Pruebas en sistema (estrés): herramientas que cargan RAM/CPU pueden revelar inestabilidad por perfiles XMP/EXPO o voltajes. Si el error aparece solo con XMP/EXPO activado, el módulo puede estar bien pero fuera de margen con esa placa/IMC.

Regla práctica: un solo error en MemTest86 ya es suficiente para tratarlo como fallo o configuración inestable. La RAM “casi estable” no existe para un sistema confiable.

Compatibilidad y parámetros: frecuencia, voltaje y perfiles (XMP/EXPO)

Conceptos clave

Frecuencia efectiva: DDR (Double Data Rate) anuncia el doble del reloj real. Ej.: DDR4-3200.
Latencias (CL, tRCD, tRP, tRAS): afectan estabilidad junto con frecuencia.
Voltaje: perfiles de alto rendimiento suelen elevarlo (ej.: DDR4 1.35V vs 1.20V JEDEC).
Perfiles XMP/EXPO: configuraciones predefinidas del fabricante para alcanzar frecuencias/latencias superiores a JEDEC. No siempre garantizan estabilidad en todas las placas/CPUs.

Guía práctica: estabilizar RAM cuando hay errores

Vuelve a valores base (JEDEC): desactiva XMP/EXPO y prueba estabilidad. Si desaparecen los fallos, el problema es de margen/compatibilidad, no necesariamente módulo defectuoso.
Actualiza BIOS/UEFI (si procede): muchas mejoras de compatibilidad de memoria llegan vía AGESA/microcódigo. Hazlo solo si el sistema es lo bastante estable o con un módulo que permita arrancar.
Reduce frecuencia un escalón: por ejemplo, de 3600 a 3200, manteniendo latencias razonables.
Verifica voltaje: usa el recomendado por el perfil; evita subir “a ciegas”. Si necesitas subir, hazlo en incrementos mínimos y con control térmico, priorizando estabilidad sobre rendimiento.
Evita mezclar kits distintos: aunque “funcionen”, pueden ser inestables por chips diferentes. Para diagnóstico, usa un solo kit homogéneo.
Comprueba población de slots: 4 módulos suelen exigir más al IMC; si con 2 módulos es estable y con 4 no, baja frecuencia o ajusta parámetros.

Ejemplo práctico de decisión

Escenario: equipo con DDR4-3600 XMP, BSOD aleatorios. Acción: desactivar XMP → estable 24 h. Diagnóstico: inestabilidad por perfil. Solución típica: BIOS actualizada + DDR4-3200/3466 estable, o kit en QVL de la placa.

Diagnóstico de SSD/HDD: SMART, sectores reasignados, temperatura y firmware

Qué es SMART y por qué importa

SMART es un conjunto de atributos internos del disco que ayudan a detectar degradación. No predice todo, pero cuando ciertos valores empeoran, el riesgo de pérdida de datos sube de forma significativa.

Atributos SMART a vigilar (en términos prácticos)

HDD: Reallocated Sectors Count (sectores reasignados), Current Pending Sector (sectores pendientes), Uncorrectable Sector Count, UDMA CRC Error Count (cable/ruido/puerto), Power-On Hours, temperatura.
SSD: Media Wearout Indicator o Percentage Used, Total Host Writes, Available Spare, errores de medios, temperatura, y estado de “throttling” térmico.

Interpretación rápida: sectores reasignados/pending en HDD suelen indicar superficie degradada. En SSD, un “Percentage Used” alto o errores de medios sugieren desgaste o fallo inminente. CRC alto apunta más a cable/puerto que al disco.

Continúa en nuestra aplicación.

Escuche el audio con la pantalla apagada.
Obtenga un certificado al finalizar.
¡Más de 5000 cursos para que explores!

O continúa leyendo más abajo...

Descargar la aplicación

Guía práctica: checklist de diagnóstico de almacenamiento

Prioriza datos: si hay síntomas de fallo (clics, SMART crítico, desconexiones), pasa primero a copia/rescate (ver sección de rescate).
Revisa conexiones: cambia cable SATA, prueba otro puerto, verifica alimentación. En NVMe, revisa fijación y disipación.
Lee SMART: usa herramientas del fabricante o utilidades confiables. Guarda captura/registro para comparar.
Comprueba temperatura: SSD NVMe puede degradar rendimiento por calor. Si ves picos altos, mejora flujo de aire/disipador.
Ejecuta pruebas del fabricante: “short test” primero; “extended” solo si el disco está estable y ya respaldaste datos.
Firmware: revisa si hay actualización que corrija bugs (especialmente NVMe). Actualiza solo tras backup y con energía estable.

Señales de reemplazo inmediato

HDD con sectores pendientes que aumentan o errores no corregibles.
SSD con errores de medios, desconexiones, o degradación abrupta de rendimiento no explicada por temperatura.
SMART con estado “Bad” o pruebas extendidas fallidas.

Flujo de problemas de arranque: BCD/EFI, particiones y sistema de archivos

Principio operativo

Los problemas de arranque pueden venir de: (1) disco fallando (hardware), (2) estructura de particiones/EFI dañada, (3) BCD/bootloader corrupto, (4) sistema de archivos con errores. Antes de reparar, confirma que el almacenamiento es confiable y protege los datos.

Flujo recomendado (de menos invasivo a más invasivo)

Evaluación rápida de riesgo: si SMART es malo, hay ruidos, o el disco se desconecta, no ejecutes reparaciones intensivas. Ve a rescate.
Arranque alternativo: inicia desde un USB de recuperación/instalación para acceder a herramientas sin depender del sistema instalado.
Identifica modo de arranque: UEFI (con partición EFI) vs Legacy/MBR. Esto define qué reparar.
Verifica particiones: confirma que existen la partición del sistema (Windows) y la EFI (si UEFI). Un cambio de orden de discos o clonación puede romper rutas.
Repara sistema de archivos: si el disco está sano, ejecuta comprobaciones (por ejemplo, chkdsk) con criterio: en discos con sospecha de fallo físico, puede empeorar la situación.
Repara archivos de sistema: en entornos Windows, herramientas como sfc y dism pueden corregir corrupción lógica.
Repara bootloader: BCD/EFI según corresponda.

Comandos útiles en Windows (desde Entorno de Recuperación)

1) Identificar discos/particiones

diskpart
list disk
list vol
exit

2) Comprobar sistema de archivos (usar con cautela si sospechas fallo físico)

chkdsk C: /f

3) Reparar archivos de sistema (si Windows está en C:)

sfc /scannow /offbootdir=C:\ /offwindir=C:\Windows

4) Reparar arranque (casos comunes)

bootrec /fixmbr
bootrec /fixboot
bootrec /scanos
bootrec /rebuildbcd

5) Reconstruir archivos de arranque UEFI (ejemplo típico)

bcdboot C:\Windows /l es-es /s S: /f UEFI

En el comando anterior, S: debe ser la letra asignada a la partición EFI (se asigna con diskpart). Ajusta idioma y letras según tu caso.

Errores frecuentes y su lectura

“Access is denied” en /fixboot: a veces se relaciona con partición EFI mal montada o permisos; suele resolverse montando correctamente la EFI y usando bcdboot.
“Inaccessible boot device”: puede ser controlador/modo SATA (AHCI/RAID), corrupción, o disco fallando. Verifica cambios recientes y salud del disco.
Bucles de reparación: si reaparecen tras “arreglar”, sospecha almacenamiento inestable o corrupción por RAM.

Estrategias de copia y rescate de datos antes de cambios invasivos

Reglas de oro

Si el disco es sospechoso, copia primero. Reparar después.
Minimiza escrituras en el disco afectado: evita reinstalaciones, “optimizadores”, y pruebas extendidas destructivas.
Trabaja con destino distinto: otro disco interno, externo USB, o red.

Guía práctica: rescate seguro (nivel usuario)

Arranca desde un medio externo (WinPE/USB de recuperación o un Linux Live) para no depender del sistema dañado.
Monta el disco en modo lectura si es posible (especialmente en Linux) para reducir riesgos.
Copia por prioridad: documentos, fotos, proyectos, bases de datos locales, perfiles de navegador, claves/archivos de licencia. Luego el resto.
Verifica integridad: abre una muestra de archivos copiados; si hay archivos críticos, calcula hashes o compara tamaños.

Guía práctica: rescate robusto (cuando hay sectores malos)

Imaging/clonado por bloques: crea una imagen del disco a otro de igual o mayor tamaño. Esto reduce el tiempo “tocando” el disco dañado y permite intentar reparaciones sobre la copia.
Herramientas especializadas: utilidades tipo ddrescue (Linux) manejan reintentos y saltos de sectores malos de forma más segura que una copia tradicional.

Consejo operativo: si el disco hace clics o desaparece del sistema, limita encendidos y considera recuperación profesional; cada intento puede degradar más.

Verificación posterior (RAM, disco y arranque)

Checklist después de aplicar cambios

RAM: ejecutar MemTest86 (al menos varias pasadas) y una sesión de uso real (juegos/render/compilación) sin errores. Confirmar que el perfil (JEDEC o XMP/EXPO ajustado) es estable.
Almacenamiento: revisar SMART nuevamente y comparar con el registro previo. Confirmar temperaturas bajo carga y ausencia de errores CRC (si SATA).
Arranque: reinicios repetidos (5–10) para confirmar consistencia, prueba de suspensión/hibernación, y verificación de integridad del sistema de archivos.
Rendimiento: medir tiempos de arranque y carga antes/después; una mejora notable tras corregir temperatura NVMe o reemplazar disco confirma el diagnóstico.

Registro de cambios (para evitar regresiones)

Documenta: módulos/slots usados, frecuencia/voltaje, versión de BIOS/firmware, valores SMART clave y comandos aplicados. Si el problema vuelve, este registro reduce el tiempo de aislamiento.

Ahora responde el ejercicio sobre el contenido:

Si un equipo presenta fallos solo cuando está activado un perfil XMP/EXPO, ¿cuál es el primer paso recomendado para confirmar si se trata de un problema de estabilidad/compatibilidad y no de un módulo de RAM defectuoso?

¡Tienes razón! Felicitaciones, ahora pasa a la página siguiente.

¡Tú error! Inténtalo de nuevo.

El primer aislamiento recomendado es volver a valores JEDEC desactivando XMP/EXPO. Si los fallos desaparecen, el problema apunta a margen/compatibilidad o parámetros (frecuencia/voltaje/latencias), no necesariamente a un módulo defectuoso.