리눅스 하드웨어 인증 테스트 Kdump(NFS)가 재부팅 오류로 실패한 경우에 대해 알아보겠습니다.
Kdump(NFS) 테스트 시스템 커널 패닉
Kdump(NFS) 테스트는 시스템이 커널 패닉을 일으킬 때 코어 덤프를 NFS 서버에 저장하는 기능을 검증하는 테스트입니다. 이 테스트를 수행하려면 rhcert-cli 명령어를 사용하거나 웹 UI를 통해 테스트를 시작할 수 있습니다.
재부팅 오류가 발생하는 원인은 다음과 같습니다:
- rhcert-listener 서비스가 재부팅 후에 시작되지 않는 경우, 웹 UI가 SUT(System Under Test)와 다시 연결되지 않고 응답을 기다리게 됩니다. 이 문제를 해결하려면, 재부팅 전에 rhcert-listener 서비스를 활성화하거나, 재부팅 후에 수동으로 시작해야 합니다.
- /var/rhcert/bootprint 디렉토리가 이미 존재하는 경우. 이 경우, kdump.conf 파일을 재설정하거나 삭제할 수 없어서 테스트가 실패합니다. 이 문제를 해결하려면, /var/rhcert/bootprint 디렉토리를 삭제하고 테스트를 다시 실행해야 합니다.
환경:
- Red Hat Enterprise Linux 9.0 베타
- redhat-certification-8.46-20220531.1.el9.noarch
- redhat-certification-hardware-8.46-20220531.1.el9.noarch
문제 및 로그:
Kdump(NFS)에 대한 하드웨어 인증 테스트가 재부팅 오류로 실패하여 kdump(nfs) 로그에 “Could not verify reboot” 경고가 표시되고 “[Errno 21] Is a directory: ‘/var/rhcert/bootprint'” 오류가 발생합니다.
Warning found in kdump(nfs) log “Could not verify reboot” with error “[Errno 21] Is a directory: ‘/var/rhcert/bootprint'”
Warning: Could not reset /etc/kdump.conf file
[Errno 2] No such file or directory: '/var/rhcert/kdumpconf.json'
Status for kudmp service returned :
systemctl restart kdump
returned:
0
Could not delete /var/rhcert/kdumpconf.json
[Errno 2] No such file or directory: '/var/rhcert/kdumpconf.json'
증상:
- 경고: /etc/kdump.conf 파일을 재설정할 수 없습니다.
- 경고: /var/rhcert/kdumpconf.json 파일을 삭제할 수 없습니다.
- kudmp 서비스 상태가 0을 반환했습니다.
- /var/rhcert/bootprint 디렉토리 존재
근본 원인:
테스트 실행 중 하드 재부팅으로 인해 임시 파일의 올바른 정리가 방지되어 검증 단계가 실제 테스트를 실행하지 않고 반복적으로 트리거됩니다.
진단 단계:
- 임시 디렉토리 제거:
rm -rf /var/rhcert/bootprint - 인증 환경 정리:
rhcert-cli clean all - 인증 서비스 다시 시작:
rhcertd restart - 테스트 다시 실행:
rhcert-cli run --test kdump --device nfs --server <server IP>
마무리
단계를 따르고 근본 원인을 이해하면 하드웨어 인증 테스트 Kdump(NFS) 실패를 해결하고 인증 프로세스를 성공적으로 완료할 수 있습니다.
