[논문]주요 포털사이트의 응답패킷분포에 관한 연구

류귀열

doi:10.7465/jkdi.2013.24.3.437

초록
AI-Helper

연구의 목적은 대한민국 주요 3개 포털사이트의 응답패킷 분포를 연구하는 것이다. 대상은 Naver, Daum, Nate 등 포털사이트의 대표페이지이며, 실험기간은 2010년 5월 19일에서 2012년 11월 7일까지이며, 실험횟수는 4,642회 실시하였다. 분포 형태는 응답패킷의 양이 많은 Naver, Nate는 양봉분포를 이루고 있으며, Daum은 오른쪽 꼬리가 긴 분포를 이루고 있다. 분포가 동일한가에 대한 검정은 카이제곱 검정, 이표본 콜모고로프-스미르노프 검정을 통하여 3개 포털의 분포가 유의수준 1%하에서 다르다는 사실을 밝혔다. 상대도수와 백분위 수의 비교를 통해 응답패킷의 분포를 비교하였다. 그 결과 응답패킷의 분포가 Naver가 가장 큰 값을 가졌으며, 다음은 Nate이었으며, Daum은 가장 작은 값을 가졌다. 응답속도를 높이기 위해서는 네트워크 속도를 높이는 것과 병행하여 페이지를 가볍게 만들어야 한다. 본 논문은 포털들이 페이지를 가볍게 만들게 하는 경쟁을 활성화하는데 기여하기를 기대한다.

Abstract ▼ AI-Helper

The object of study is to verify the distributions of response packets of 3 portal sites such as Naver, Daum, Nate. The period of experiments is from May 19th 2010 to November 7th 2012 and the number of experiments is 4,642. The distributions of Naver, Nate are biomodals. The distribution of Daum ha...

The object of study is to verify the distributions of response packets of 3 portal sites such as Naver, Daum, Nate. The period of experiments is from May 19th 2010 to November 7th 2012 and the number of experiments is 4,642. The distributions of Naver, Nate are biomodals. The distribution of Daum has long right tails. 3 distributions are different under 1% significance level using chi-square test and two sample Kolmogorov-Smirnov test. From proportions and percentiles, Naver has a distribution with the largest values. Nate is the second place, and Daum has a distribution with the smallest values. We must make portal pages light to increase response speed including other technologies. We expect our results to activate competition among portal sites.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

연구 대상 사이트는 텍스트 기반의 단순 소개 페이지를 제공하는 Google을 제외하고, 현재 서비스 제공 중인 포털 사이트 중 방문자 수 기준으로 상위 3대 포탈 사이트인 Naver와 Daum, Nate를 선정하였다. 따라서 본 논문은 Naver와 Daum, Nate의 응답 패킷 분포를 비교 분석하는 것이 목적이다.
본 논문은 Naver와 Daum, Nate의 대표페이지의 패킷의 분포를 밝히고 비교하였다. 응답속도를 높이기 위해서는 대표 페이지를 최대한 가볍게 만들어야 한다.
확률분포에서 주 관심분야는 Hong (2000), Song (2002), Hur (2011) 등에서 설명되어 있는 바와 같이 이론적인 분야이다. 본 논문은 확률분포를 응용하기 때문에 분포를 표현하는 것이 중요한 문제이다. 분포를 표현하기 위해서 일반적으로 Jiang 등 (2010)과 같이 확률밀도함수를 이용하는 방법과 Kim(2011)과 같이 누적 확률을 이용하는 방법이 있다.
본 연구의 목적은 대한민국 주요 3개 포털사이트의 응답패킷분포를 연구하는 것이다. 실험 대상은 포털사이트의 대표페이지이며, 실험기간은 사이트의 패킷이 사계절을 포함하고 많은 자료의 수집을 위해 2010년 5월 19일에서 2012년 11월 7일까지 2년 6개월 동안 실시되었으며, 실험횟수는 4,642회 실시하였다.

제안 방법

두 번째 방법으로 포털들의 응답패킷의 백분위수를 비교하였다. 결과는 Table 3.
두 방법 모두 유의수준 1% 하에서 포털들의 응답패킷의 분포가 다르다는 사실을 알 수 있었다. 또한 분포의 비교를 위해 직접비교와 백분위 수의 비교를 실시하였다. 그 결과 Naver의 응답패킷의 분포가 가장 컸으며 다음으로 Nate, Daum 순이었다.

대상 데이터

본 연구의 목적은 대한민국 주요 3개 포털사이트의 응답패킷분포를 연구하는 것이다. 실험 대상은 포털사이트의 대표페이지이며, 실험기간은 사이트의 패킷이 사계절을 포함하고 많은 자료의 수집을 위해 2010년 5월 19일에서 2012년 11월 7일까지 2년 6개월 동안 실시되었으며, 실험횟수는 4,642회 실시하였다.
이 방법은 Ryu (2012, 2013)에서도 사용하였다. 실험은 2010년 5월 19일에서 2012년 11월 7일까지 2년 6개월 동안 실시되었으며, 실험횟수는 4,642회 실시하였다.
이는 인터넷 서비스관련 기술개발로 이어질 것으로 예상된다. 연구 대상 사이트는 텍스트 기반의 단순 소개 페이지를 제공하는 Google을 제외하고, 현재 서비스 제공 중인 포털 사이트 중 방문자 수 기준으로 상위 3대 포탈 사이트인 Naver와 Daum, Nate를 선정하였다. 따라서 본 논문은 Naver와 Daum, Nate의 응답 패킷 분포를 비교 분석하는 것이 목적이다.
연구에 사용된 컴퓨터는 데스크탑 PC (personal computer)와 노트북 컴퓨터이다. 데스크탑 PC의 사양으로 CPU (central processing unit)는 인텔 2.
포털사이트의 분포를 비교하기 위해, 먼저 모수적 방법인 카이제곱 검정을 실시하였다. 카이제곱 검정을 위해 구간을 31개로 분할하였다. 검정결과는 Table 3.

데이터처리

비모수적 검정을 위해 이표본 콜모고로프-스미르노프 검정을 실시하였다. 검정결과는 Table 3.
응답패킷 양의 분포비교는 모수적 방법으로 카이제곱 검정, 비모수적 방법으로 이표본 콜모고로프-스미르노프 검정을 실시하였다. 두 방법 모두 유의수준 1% 하에서 포털들의 응답패킷의 분포가 다르다는 사실을 알 수 있었다.
포털사이트의 분포를 비교하기 위해, 먼저 모수적 방법인 카이제곱 검정을 실시하였다. 카이제곱 검정을 위해 구간을 31개로 분할하였다.

이론/모형

2Gbyte, OS는 Windows XP이다. 본 실험에서 사용하는 브라우저는 브라우저가 제공하는 측정도구를 사용하기 위해 네스케이프 사에서 개발한 firefox를 사용하였으며, 패킷량 측정은 firebug에서 제공하는 네트워크 관리 툴을 사용하였다. Figure 2.
이는 두 모집단의 분포가 동일하다면 근사적으로 카이제곱 분포를 한다는 사실에 기초하고 있다. 비모수적 검정은 Kim과 Oh (2003), Hong과 Kim (2003) 등에서 설명되어 있는 것과 같이 이표본 콜모고로프-스미르노프 (Kolmogov-Smirnov) 검정을 사용할 수 있다. 이표본 콜모고로프 스미르노프 검정통계량은
분포를 표현하기 위해서 일반적으로 Jiang 등 (2010)과 같이 확률밀도함수를 이용하는 방법과 Kim(2011)과 같이 누적 확률을 이용하는 방법이 있다. 우리는 확률밀도함수의 형태인 히스토그램 형태로 분포를 표현하고, 분포를 비교하기 위해서 누적확률을 이용하는 방법인 백분위수를 이용할 것이다. 두 모집단을 비교하는 방법은 Han 등 (2012), Lee 등 (2012), Han과 Kang (2012) 등에서 설명된 바와 같이 주로 평균을 비교하는 방법이다.

성능/효과

4에 나와 있다. 결과를 보면 Naver가 Daum보다 응답패킷이 많을 비율은 79.77%, Nate에 70.10%이므로 Naver의 응답패킷이 Daum과 Nate보다 많음을 알 수 있다. Daum이 Nate보다 응답패킷이 많을 비율은 42.
또한 분포의 비교를 위해 직접비교와 백분위 수의 비교를 실시하였다. 그 결과 Naver의 응답패킷의 분포가 가장 컸으며 다음으로 Nate, Daum 순이었다.
그러나 연구를 통해 같은 페이지라 할지라도 응답패킷의 양이 클 경우 반복 실험 시 패킷의 변화량이 크고 양이 작을 경우 패킷의 변화량이 적다는 사실을 알 수 있었다. 후 속 연구를 통해 이러한 현상을 규명할 필요가 있다.
응답패킷 양의 분포비교는 모수적 방법으로 카이제곱 검정, 비모수적 방법으로 이표본 콜모고로프-스미르노프 검정을 실시하였다. 두 방법 모두 유의수준 1% 하에서 포털들의 응답패킷의 분포가 다르다는 사실을 알 수 있었다. 또한 분포의 비교를 위해 직접비교와 백분위 수의 비교를 실시하였다.
후 속 연구를 통해 이러한 현상을 규명할 필요가 있다. 또한 어떤 콘텐츠가 데이터 량에 많은 영향을 주는지를 밝힘으로써 동일한 콘텐츠라도 가볍게 만들 수 있는 기술을 확보할 수 있으며 응답속도를 높일 수 있다. 또한 포털사이트들의 응답속도가 이용자들의 만족도에 많은 영향을 주기 때문에 응답속도에 관한 후속 연구도 필요하다.

후속연구

또한 다른 요인들이 같다는 가정 하에서 응답속도는 응답패킷에 반비례하므로, 이용자들은 이러한 정보들을 이용하여 어느 사이트가 상대적으로 빠른 응답을 할 것이라는 전망을 할 수 있다. 따라서 포탈 사이트들은 이용자들의 빠른 응답에 대한 욕구를 충족시키는 방법 중의 하나로 응답 패킷을 줄이려는 기술개발에 노력할 것이다. 이는 인터넷 서비스관련 기술개발로 이어질 것으로 예상된다.
또한 어떤 콘텐츠가 데이터 량에 많은 영향을 주는지를 밝힘으로써 동일한 콘텐츠라도 가볍게 만들 수 있는 기술을 확보할 수 있으며 응답속도를 높일 수 있다. 또한 포털사이트들의 응답속도가 이용자들의 만족도에 많은 영향을 주기 때문에 응답속도에 관한 후속 연구도 필요하다. 무선인터넷의 요금은 주로 종량제이므로 무선인터넷 포탈의 응답패킷 연구는 이용자들의 효율적인 이용에 도움을 줄 것으로 기대된다.
또한 포털사이트들의 응답속도가 이용자들의 만족도에 많은 영향을 주기 때문에 응답속도에 관한 후속 연구도 필요하다. 무선인터넷의 요금은 주로 종량제이므로 무선인터넷 포탈의 응답패킷 연구는 이용자들의 효율적인 이용에 도움을 줄 것으로 기대된다. 이러한 후속 연구들은 포탈들의 기술경쟁을 촉진시켜 더욱 효율적인 페이지를 구축하도록 유도할 것으로 기대된다.
무선인터넷의 요금은 주로 종량제이므로 무선인터넷 포탈의 응답패킷 연구는 이용자들의 효율적인 이용에 도움을 줄 것으로 기대된다. 이러한 후속 연구들은 포탈들의 기술경쟁을 촉진시켜 더욱 효율적인 페이지를 구축하도록 유도할 것으로 기대된다.

질의응답

핵심어	질문	논문에서 추출한 답변
	우리나라 유선인터넷은 언제 어떻게 시작되었는가?	우리나라에서 유선인터넷은 1982년 서울대와 한국전자기술연구소와의 시범망을 구축함으로써 시작되었다. 이 때 학술용도로 인터넷 네트워크를 이용하기 시작하여, 1986년에는 국가도메인인.
	HTTP 프로토콜은 어떤 목적으로 제안되었는가?	인터넷에서 사용되는 HTTP (hypertext transfer protocol) 프로토콜은 FTP (file transfer protocol)에서의 파일전송의 비효율성을 줄이기 위해 제안된 것으로 지금은 널리 사용되고 있는 프로토콜이다. Touch 등 (1996)에 의하면 HTTP에서의 데이터 수신은 먼저 클라이언트와 서버의 채널을 열기 위해 RTT (round-trip time) 시간이 소요된다.
	Naver의 응답 패킷 분포는 어떻게 되는가?	양봉분포는 이질적인 두 분포가 합쳐진 형태로, Naver의 응답 패킷은 패킷량이 작은 분포와 많은 분포로 나뉘어질 수 있다는 것을 알 수 있다. 평균은 304.8Kbyte, 표준편차는 328.8Kbyte, 최소값은 7.9Kbyte, 최대값은 5.846Mbyte로 응답패킷의 분포가 넓게 분포되어 있다. Daum의 응답패킷의 분포는 Figure 3.

참고문헌 (15)

Han, D. and Kang, M. (2012). Study on application of information and communication technology in special education. Journal of the Korean Data & Information Science Society, 23, 927-937.

원문보기 상세보기
Han, J., Lee, K. and Yang, J. (2012). The effects of the 16-weeks' combined exercise program on metabolic syndrome and autonomic nerve system of low-level physical strength group. Journal of the Korean Data & Information Science Society, 23, 895-904.

원문보기 상세보기
Hong, J. (2000). Statistical probability distribution, Freeacademy, Kyeonggi.
Hong, J. and Kim, J. (2009). Nonparametric homogeneity tests of two distributions for credit rating model validation. Journal of the Korean Data & Information Science Society, 20, 261-272.
Hur, M. (2011). Mathematical statistic, Parkyoungsa, Seoul.
Jiang, Z., Kim, J. and Yoon, S. (2010). The analysis of inequality of firm size distribution. Journal of the Korean Data Analysis Society, 12, 2185-2194.
Kim, D. and Oh, K. (2003). On the equality of two distributions based on nonparametric kernel density estimator. Journal of the Korean Data & Information Science Society, 14, 247-255.

원문보기 상세보기
Kim, T. (2011). Visualization analysis of small and medium enterprises survival distribution after IMF. Journal of the Korean Data Analysis Society, 13, 441-455.
Korea Internet & Security Agency (2012). 2011 Korea internet white paper, Korea Internet & Security Agency, Kyeonggi.
Lee, S., Cho, Y. and Yang, J. (2012). A study on the effects of a 12-week compound exercise program on obese middle school girls' leptin and insulin levels Journal of the Korean Data & Information Science Society, 23, 787-796.

원문보기 상세보기
Press, W., Teukoisky, S., Vettering, W. and Flannery, B. (2002). Numerical recipes in C, Cambridge University Press, Cambridge.
Ryu, G. (2012). A study on response time of WiBro depending on signal intensity. Journal of the Korean Data Analysis Society, 14, 1119-1128.
Ryu, G. (2103). A study on comparing response times between Wibro and wired internet using portals. Journal of the Korean Data & Information Science Society, 24, 23-32.

원문보기 상세보기
Song, M. (2002). Mathematical statistics, Parkyoungsa, Seoul.
Touch, J., Heidemann, J. and Obraczka, K. (1996). Analysis of HTTP performance, USC/ISI Research Report 98-463, 1-10.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

주요 포털사이트의 응답패킷분포에 관한 연구
A study on distribution comparison of response packets for major portal sites 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (15)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

주요 포털사이트의 응답패킷분포에 관한 연구 A study on distribution comparison of response packets for major portal sites 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (15)

이 논문을 인용한 문헌

저자의 다른 논문 :

류귀열 (10)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

주요 포털사이트의 응답패킷분포에 관한 연구
A study on distribution comparison of response packets for major portal sites 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper