$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

텍스트 마이닝을 통한 해외건설공사 입찰정보 분석 - 해외건설공사의 입찰자 질의(Bidder Inquiry) 정보를 대상으로 -
Construction Bid Data Analysis for Overseas Projects Based on Text Mining - Focusing on Overseas Construction Project's Bidder Inquiry 원문보기

한국건설관리학회논문집 = Korean journal of construction engineering and management, v.17 no.5, 2016년, pp.89 - 96  

이지희 (이화여자대학교 건축공학과) ,  이준성 () ,  손정욱 (이화여자대학교 건축공학과)

초록
AI-Helper 아이콘AI-Helper

건설 프로젝트에서 생산되는 대부분의 데이터는 텍스트 기반의 비정형 데이터이다. 계약서, 시방서, RFi 등 수많은 텍스트 문서들을 효과적으로 분석하기 위해서는 텍스트 마이닝과 같은 비정형 텍스트 데이터 분석 방법이 필요하다. 이에 본 연구에서는 과거에 수행되었던 해외건설공사 프로젝트의 입찰 관련 문서들을 대상으로 텍스트 마이닝을 실시하였으며, 그 결과 빈출단어의 유형, 단어들 간의 연관관계, 문서들의 토픽 유형들에 대한 파악이 가능하였다. 본 연구는 텍스트 마이닝을 활용한 해외건설공사 입찰 정보 분석을 통해 비정형 텍스트 데이터를 효과적으로 분석할 수 있는 방안을 제시하였다는 점에서 의의가 있으며, 향후 관련 분야 연구를 확장시킬 수 있는 기반을 마련할 수 있을 것이라 기대한다.

Abstract AI-Helper 아이콘AI-Helper

Most data generated in construction projects is unstructured text data. Unstructured data analysis is very needed in order for effective analysis on large amounts of text-based documents, such as contracts, specifications, and RFI. This study analysed previously performed project's bid related docum...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 2) 또한 불용어는 아니지만 ‘inquiry’,‘response’, ‘contractor’등과 같이 입찰자 질의서에 반복적으로 등장하는 단어들은 그 자체가 분석에 있어 특정한 의미를 갖지 못하기 때문에 효과적인 분석 및 작업 속도의 향상을 위해 제거하였다.
  • 예를 들어,‘specification’이라는 단어가 문서 내에서 어떠한 의미로 쓰였는지 이해하기 위해 연관규칙 분석을 실시함으로써 문장 내 의미를 보다 정확히 파악하고자 하였다.
  • 이에 본 연구에서는 방대한 양의 문서를 단시간 안에 효과적으로 분석할 수 있는 텍스트 마이닝(text mining)을 비롯한 비정형 텍스트 데이터 분석 방법 기술을 활용하여 해외건설공사의 입찰정보를 분석하고, 시사성 있는 정보를 도출하여 향후 활용방안을 모색하고자 한다. 이를 위해 입찰문서 내 불확실한 정보 및 누락사항 등을 사전에 검토하여 입찰 전 발주자에게 질의하는 ‘입찰자 질의(bidder inquiry)’ 정보를 대상으로 텍스트 분석을 실시함으로써 어떤 유형의 리스크 요인이 입찰문서에 존재하고, 입찰문서에서 어떤 부분을 사전에 검토하여 발주자에게 질의하여야 하는지에 대한 전반적인 이해를 돕고자 한다.
  • 연관규칙 분석은 장바구니 분석 사례로도 알려져 있는 데이터 마이닝 기법으로 어떤 사건이 얼마나 자주 동시에 발생하는가를 표현하는 규칙 또는 조건을 의미한다(Yu and Hong, 2015). 입찰 질의서에 대한 연관규칙 분석은 동일한 입찰 질의서 내에 특정 단어가 등장할 때 공통적으로 발견되는 단어들이 무엇인지를 파악하기 위한 목적으로 실시하였다. 예를 들어,‘specification’이라는 단어가 문서 내에서 어떠한 의미로 쓰였는지 이해하기 위해 연관규칙 분석을 실시함으로써 문장 내 의미를 보다 정확히 파악하고자 하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
건설 프로젝트에서 생산되는 대부분의 데이터는 어떤 데이터인가? 건설 프로젝트에서 생산되는 대부분의 데이터는 텍스트 기반의 비정형 데이터이다. 계약서, 시방서, RFi 등 수많은 텍스트 문서들을 효과적으로 분석하기 위해서는 텍스트 마이닝과 같은 비정형 텍스트 데이터 분석 방법이 필요하다.
비정형 텍스트 데이터 분석 방법이 건설공사에서 필요한 이유는? 건설 프로젝트에서 생산되는 대부분의 데이터는 텍스트 기반의 비정형 데이터이다. 계약서, 시방서, RFi 등 수많은 텍스트 문서들을 효과적으로 분석하기 위해서는 텍스트 마이닝과 같은 비정형 텍스트 데이터 분석 방법이 필요하다. 이에 본 연구에서는 과거에 수행되었던 해외건설공사 프로젝트의 입찰 관련 문서들을 대상으로 텍스트 마이닝을 실시하였으며, 그 결과 빈출단어의 유형, 단어들 간의 연관관계, 문서들의 토픽 유형들에 대한 파악이 가능하였다.
본 연구에서 텍스트 기반의 해외건설공사 입찰문서 내 정보를 효과적으로 분석하기 위해 텍스트마이닝 분석툴로 R 프로그래밍을 사용하였는데, 어떤 특징이 있는가? 또한 통계분석용 오픈 소스 소프트웨어인 R 프로그래밍을 통하여 비정형 텍스트 문서를 구조화하고, 분석 및 시각화하는 작업을 실시하였다. R은 패키지뿐만 아니라 일종의 프로그래밍 언어로서 기본적인 통계 기법부터 모델링, 데이터 마이닝 기법까지 구현이 가능하며, 구현한 결과는 그래프 등으로 시각화할 수 있다. 또한 Java나 C,Python 등 다른 프로그래밍 언어와 연결이 용이하여 프로젝트 특성에 맞는 독창적인 통계기법의 사용이 가능하다(Yim,2015)는 장점이 있어 본 연구의 텍스트 마이닝을 위한 분석툴로 선정하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (10)

  1. Caldas, C., Soibelman, L., and Han, J. (2002). "Automated Classification of Construction Project Documents." Journal of Computing in Civil Engineering, pp. 234-243. 

  2. Caltrans (2016). "Caltrans Bidders Inquiries." http://www.dot.ca.gov/hq/esc/oe/inquiry/bid_inquiries.php. 

  3. Kim, J. H., and Kim, Y. S. (2014). "An Analysis of Concentrate Competency in Bidding Process for Overseas Project of Domestic Construction Companies." Korean Journal of Construction Engineering and Management, KICEM, 15(3), pp. 23-30. 

  4. Lee, J. H., Yi, J. S, and Son, J. W. (2016). "Unstructured Construction Data Analytics Using R Programming - Focused on Overseas Construction Adjudication Cases." Journal of the Architectural Institute of Korea, AIK, 32(5), pp. 37-44. 

  5. Mao, W., Zhu, Y., and Ahmad, I. (2007). "Applying metadata models to unstructured content of construction documents: A view-based approach. Automation in Construction." 16(2), pp. 242-252. 

  6. Seo, J. P., Ryu, H. G., Son, B. S., and Choi, Y. K. (2016). "The Development of Risk Management Process Model during Bidding Phase for Success of Oversea." Korean Journal of Construction Engineering and Management, KICEM, 17(4), pp. 76-86. 

  7. Simoff, S. J., and Maher, M. L. (1998). "Ontology-based multimedia data mining for design information retrieval." Computing in Civil Engineering, K. C. P. Wang, T. Adams, M. L. Maher, and A. Songer, eds., ASCE, Reston, Va., pp. 212-223. 

  8. Tanaka, T. (1988). "Analysis of claims in U.S. construction projects." Master thesis, Massachusetts Institute of Technology, Boston. 

  9. Yim, D. (2015). Big data analysis using R, Free academy, pp. 21-50. 

  10. Yu, C. H., and Hong, S. H. (2015). R Visualization, Insight. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로