[국내논문]어셈블리어 코드 기반의 Invalid Function Pointer Access Error 가능성 검출 Detection of Potential Invalid Function Pointer Access Error based on Assembly Codes원문보기
일반적으로 컴파일러가 프로그램 번역시 메모리 사용 오류에 대한 검사도 병행하지만, 코드 레벨에서는 검사가 불가능한 함수 포인터는 정상적인 검사가 매우 힘들다. 이에 본 논문에서는 실행 프로그램을 역어셈블하여 만들어진 어셈블리 언어 프로그램을 구문 분석하여 함수 포인터 사용의 형태(패턴)를 어셈블리 명령어 전이도를 기반으로 "Invalid Function Pointer Access Error"에 대한 오류 가능성을 검출한다. 검사대상인 3개 프로그램은 약 10,000개의 함수와 1,000,000 개의 어셈블리 명령어로 구성되어 있으며, 본 논문에서 제안한 방법을 사용하여 함수 포인터의 사용 오류를 검출한 결과 1,100개의 함수 포인터 사용 중 약 500개의 비정상적 함수 포인터의 사용을 검출하였으며 검출에 걸린 시간은 총 82초 정도가 소요되었다.
일반적으로 컴파일러가 프로그램 번역시 메모리 사용 오류에 대한 검사도 병행하지만, 코드 레벨에서는 검사가 불가능한 함수 포인터는 정상적인 검사가 매우 힘들다. 이에 본 논문에서는 실행 프로그램을 역어셈블하여 만들어진 어셈블리 언어 프로그램을 구문 분석하여 함수 포인터 사용의 형태(패턴)를 어셈블리 명령어 전이도를 기반으로 "Invalid Function Pointer Access Error"에 대한 오류 가능성을 검출한다. 검사대상인 3개 프로그램은 약 10,000개의 함수와 1,000,000 개의 어셈블리 명령어로 구성되어 있으며, 본 논문에서 제안한 방법을 사용하여 함수 포인터의 사용 오류를 검출한 결과 1,100개의 함수 포인터 사용 중 약 500개의 비정상적 함수 포인터의 사용을 검출하였으며 검출에 걸린 시간은 총 82초 정도가 소요되었다.
Though a compiler checks memory errors, it is difficult for the compiler to detect function pointer errors in code level. Thus, in this paper, we propose a method for effectively detecting Invalid function pointer access errors, by analyzing assembly codes that are obtained by disassembling an execu...
Though a compiler checks memory errors, it is difficult for the compiler to detect function pointer errors in code level. Thus, in this paper, we propose a method for effectively detecting Invalid function pointer access errors, by analyzing assembly codes that are obtained by disassembling an executable file. To detect the errors, assembly codes in disassembled files are checked out based on the instruction transition diagrams which are constructed through analyzing normal usage patterns of function pointer access. When applying the proposed method to various programs having no compilation error, a total of about 500 potential errors including the ones of well-known open source programs such as Apache web server and PHP script interpreter are detected among 1 million lines of assembly codes corresponding to a total of about 10 thousand functions.
Though a compiler checks memory errors, it is difficult for the compiler to detect function pointer errors in code level. Thus, in this paper, we propose a method for effectively detecting Invalid function pointer access errors, by analyzing assembly codes that are obtained by disassembling an executable file. To detect the errors, assembly codes in disassembled files are checked out based on the instruction transition diagrams which are constructed through analyzing normal usage patterns of function pointer access. When applying the proposed method to various programs having no compilation error, a total of about 500 potential errors including the ones of well-known open source programs such as Apache web server and PHP script interpreter are detected among 1 million lines of assembly codes corresponding to a total of about 10 thousand functions.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
제안 방법
다양한 메모리 오류가 있지만 본 논문에서는 Invalid Function Pointer Access Error에 대해서만 다루었다. Invalid Function Pointer Access Error에 대한 유형을 파악한 후 이를 상태기반으로 검사하는 방법을 사용하였다.
소스 코드를 분석하여 메모리 오류를 검출하는 경우 개발자의 구현 스타일을 고려해야하기 때문에 구현 스타일에 대한 경우의 수가 많고, 소스 코드의 최적화 과정이 필요하다. 그러나 본 논문에서 제안한 방법은 실행 파일을 역어셈블하여 획득한 어셈블리어를 분석하여 오류를 검출한다. 이 방법은 컴파일러에 의해 코드가 최적화된 실행파일을 사용하기 때문에 구현 스타일에 대한 제약 사항이 줄어든다.
이에 본 논문에서는 실행 파일을 역어셈블하여 만든 어셈블리어를 분석하여 오류를 검출하는 방법을 사용하였다. 다양한 메모리 오류가 있지만 본 논문에서는 Invalid Function Pointer Access Error에 대해서만 다루었다. Invalid Function Pointer Access Error에 대한 유형을 파악한 후 이를 상태기반으로 검사하는 방법을 사용하였다.
대상 프로그램들은 C언어로 작성되었으며 x86 기반 리눅스 시스템에서 gcc 버전 4로 컴파일하여 실행파일을 만들었고, 동일 시스템의 objdump 툴로 역어셈블하였다.
본 논문에서는 실행 파일을 역어셈블하여 만들어진 어셈블리어를 기반으로 “Invalid Function Pointer Access Error”에 대해 메모리 사용의 정상적 유형에 대한 명령어 전이도를 정의하였다.
함수 포인터의 경우 프로그램 로직 상 변경 가능하므로 실제 로직의 구성을 알아야 함수 호출 스택을 역추적 하여 저장되는 값의 관찰이 가능하다. 본 논문에서는 어셈블리어 명령어 구문 분석을 이용하여 오류의 가능성을 판별하기 때문에 함수 포인터를 이용하는 방법 중 저장된 값들을 분석하여 오류를 판별하는 방법은 고려하지 않는다.
Test Monitor[2]는 [그림 1]과 같이 소스 코드에 로깅 시스템을 추가하고, Test Monitor에서 소스 코드가 컴파일되어 실행 파일이 생성된다. 생성된 실행 파일을 Test Monitor에서 실행하는 방법으로 [표 2]에 기술된 에러 중 Stack Overflow Error와 Invalid Function Pointer Access Error를 제외한 나머지 에러를 검출한다. Valgrind는 x86 기계어 해석기를 탑재하고 있고, 해석기를 통해 대상 프로그램의 기계 명령어를 실행하여 메모리 오류를 추적한다.
오픈 소스인 아파치 웹 서버, PHP 프로그램을 컴파일 후 역어셈블하여 만들어진 어셈블리어 코드를 입력 값으로 정상적 유형의 명령어 전이도를 벗어나는지에 따라 메모리 오류의 가능성을 검출하였다.
MEDS[4]는 두 단계에 걸쳐 메모리 오류를 검출한다. 이 시스템은 [그림 3]처럼 어셈블리어를 분석하고 변수 타입을 메타데이터로 기록을 하는 단계와 기록된 메타데이터를 기반으로 어셈블리어 코드를 가상으로 실행하여 메모리 오류를 검출하는 단계로 나누어 buffer overflow, Uninitialized data reads, double-free, 해제된 메모리 접근 및 취약성을 검출한다.
이에 본 논문에서는 실행 파일을 역어셈블하여 만든 어셈블리어를 분석하여 오류를 검출하는 방법을 사용하였다. 다양한 메모리 오류가 있지만 본 논문에서는 Invalid Function Pointer Access Error에 대해서만 다루었다.
대상 데이터
본 논문에서 성능을 분석하기 위하여 실험한 데이터는 본 논문에서 구현한 검출 도구(대상 1), 오픈 소스 프로젝트인 아파치 웹 서버[6]의 실행파일 중 httpd(대상 2)와 PHP 스크립트 해석기[7]의 실행 파일 중 php(대상 3)를 사용하였다.
성능/효과
Invalid Function Pointer Access Error 가능성 검출 결과는 표 4와 같다. 대상1에서는 함수 포인터의 사용이 존재하지 않았고, 대상 2에서 총 함수 포인터를 124회 호출 하지만 Null 검사가 이루어지지 않고 호출한 횟수가 59회로 47.6%의 발생 비율이고 대상 3에서는 987회의 함수 포인터 호출 중 445회가 Null 검사를 하지 않아 45.1%의 결과를 보이고 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.