Development and application of ANN approach based on UPLC FT-ICR MS data to understand seasonal and regional differences in organic constituents of PM2.5 in East Asia : 동아시아 초미세먼지 유기화학 성분의 계절 및 지역 차이 이해를 위한 초고성능 액체 크로마토그래피 결합 초고분해능 질량분석기 데이터 기반 인공신경망 접근법 개발 및 적용원문보기
작은 입자크기로 대기환경에서 생성 및 부유하는 초미세먼지 (공기역학적 직경 ≤ 2.5 μm)는 유기, 무기염, 중금속 등 구성성분이 복합적이다. 또한, 초미세먼지는 다양한 요인 (발생지역, 날씨, 기온, 습도 등)에 의해 생성되므로 정확한 데이터 해석을 위해 많은 데이터 개수가 요구된다. 따라서, 복합 혼합물 및 대규모 연구가 요구되는 초미세먼지 데이터 분석은 해석에 어려움이 있다. 따라서, 본 연구에서는 지역/계절별 미세먼지 구성 복합 유기성분 차이 규명을 위해 초고성능 액체 크로마토그래피 (...
작은 입자크기로 대기환경에서 생성 및 부유하는 초미세먼지 (공기역학적 직경 ≤ 2.5 μm)는 유기, 무기염, 중금속 등 구성성분이 복합적이다. 또한, 초미세먼지는 다양한 요인 (발생지역, 날씨, 기온, 습도 등)에 의해 생성되므로 정확한 데이터 해석을 위해 많은 데이터 개수가 요구된다. 따라서, 복합 혼합물 및 대규모 연구가 요구되는 초미세먼지 데이터 분석은 해석에 어려움이 있다. 따라서, 본 연구에서는 지역/계절별 미세먼지 구성 복합 유기성분 차이 규명을 위해 초고성능 액체 크로마토그래피 (UPLC)와 결합된 음이온 모드 대기압화학이온화 퓨리에 변환 이온 싸이클로트론 공명 질량분석기((-)APCI FT-ICR MS)를 활용해 분석했으며 데이터 해석을 위해 인공신경망 (ANN)회귀분석, 분류분석을 적용했다. 분석법 구축을 위해, 2장) 근적외선 스펙트럼과 메타데이터를 이용한 회귀분석 및 검증, 3장) 질량분석 데이터와 메타데이터 간의 상관관계 회귀분석, 4장) 질량분석 데이터를 이용한 분류분석을 수행했다. 5장과 6장에서는 2 − 4장에서 최적화 및 구축한 분석법을 활용해 계절별로 수집된 메가시티 세 지역 울란바토르, 베이징, 서울 초미세먼지 시료를 분석해 지역 간 초미세먼지 데이터 비교 및 분류분석을 수행했다. 5장에서는 각 지역 초미세먼지 구성 특이 화학종 규명을 위해 겨울철 수집된 85개 시료, 340개 UPLC (-)APCI FT-ICR MS 데이터 (시료당 4반복 실험)와 초미세먼지 질량 농도의 ANN 회귀분석을 수행했다. UPLC (-)APCI FT-ICR MS 데이터 기반 ANN 회귀분석 결과, 지방족/지질 유래 유기 황산화물, 다환 방향족 유기 산화물이 울란바토르 초미세먼지 구성 화합물의 특징임을 알 수 있었다. 반면, 베이징과 서울에서는 지방족/지질 유래 유기 산화물이 초미세먼지 구성 주요 성분이었다. 또한, 지역 간 초미세먼지 구성 복합 유기성분 차이 해석을 위해 각 지역별 초미세먼지 질량 농도가 높은 9개 시료를 선정해 UPLC (-)APCI FT-ICR MS 데이터 기반 ANN 분류분석을 수행했다 (총 27개 시료, 108개 질량분석 데이터). 지방족/지질 유래 유기 황산화물과 다환 방향족 유기 산화물이 울란바토르 초미세먼지가 다른 두 지역과 구분되는 특이 화학종이었으며 울란바토르는 석탄/바이오매스 연소가 주 에너지원으로 미세먼지 발생 주요 오염원으로 확인되었다. 반면 베이징의 경우, 방향족 유기 질소산화물이 다른 지역과 구별할 수 있는 화학종으로 디젤 구동 대형 트럭과 버스의 배출가스가 베이징 미세먼지 발생 특정 오염원임을 알 수 있었다. 더불어, 베이징과 서울 초미세먼지는 지방족/지질 유래 산화물이 특징적인 화합물로 나타났으며, 이는 석유 연소 시 발생하는 대표 화학종이다. 6장에서는 계절에 따른 각 지역 초미세먼지 구성 복합 유기성분 차이 해석을 위해 여름/겨울별로 수집된 3개 메가시티 울란바토르, 베이징, 서울 초미세먼지 시료의 UPLC (-)APCI FT-ICR MS 데이터 기반 ANN 분류분석을 수행했다 (총 173개 시료, 692개 질량분석 데이터). 겨울철 초미세먼지에서 세 지역 모두 다환 방향족 유기 산화물이 특이 화학종으로 검출되었다. 더불어, 울란바토르 겨울철 초미세먼지는 지방족/지질 유래 유기 황산화물이 다른 지역과 구분되는 화합물로 나타났다. 반면 세 지역 여름철 초미세먼지 모두, 지방족/지질/리그닌/단백질 유래 유기 산화물이 겨울철 초미세먼지와 구분되는 특이 화학종으로 나타났다. 여름철 울란바토르 초미세먼지는 다환 방향족 유기 질소산화물, 여름철 서울 초미세먼지는 불포화 유기 질소산화물이 다른 지역과 차이가 나타나는 화합물로 나타났다. 종합적으로, 겨울철 초미세먼지는 석탄, 석유와 같이 연료 연소에 의한 발생 (다환 방향족 유기 화합물), 여름철 초미세먼지의 경우 자연 생태계 활동에 의한 발생 (지질, 리그닌, 단백질 유래 화합물)임을 알 수 있었으며 지역 특성에 따라 세부 차이가 나타남을 확인했다. 본 연구는 UPLC (-)APCI FT-ICR MS 및 ANN 분석을 기반으로 지역/계절에 따른 대기오염의 유기화학적 차이 분석에 중점을 두고 세 지역 초미세먼지의 구성 유기 화합물 및 발생원에 대한 포괄적인 이해를 제공했다. 이 연구는 ANN 모델을 대규모 초고분해능 질량분석 데이터세트에 적용한 최초의 사례이며 초미세먼지 간 복합 유기 화합물에 대해 분자 수준의 정보를 제공할 수 있다. 전반적으로, 이 연구는 대기오염을 줄이고 공중보건을 개선하기 위한 효과적인 전략 구상에 필수적인 동북아 초미세먼지 출처와 구성 및 2차 유기 에어로졸 발생에 대한 더 나은 이해에 기여할 것으로 기대한다.
작은 입자크기로 대기환경에서 생성 및 부유하는 초미세먼지 (공기역학적 직경 ≤ 2.5 μm)는 유기, 무기염, 중금속 등 구성성분이 복합적이다. 또한, 초미세먼지는 다양한 요인 (발생지역, 날씨, 기온, 습도 등)에 의해 생성되므로 정확한 데이터 해석을 위해 많은 데이터 개수가 요구된다. 따라서, 복합 혼합물 및 대규모 연구가 요구되는 초미세먼지 데이터 분석은 해석에 어려움이 있다. 따라서, 본 연구에서는 지역/계절별 미세먼지 구성 복합 유기성분 차이 규명을 위해 초고성능 액체 크로마토그래피 (UPLC)와 결합된 음이온 모드 대기압화학이온화 퓨리에 변환 이온 싸이클로트론 공명 질량분석기((-)APCI FT-ICR MS)를 활용해 분석했으며 데이터 해석을 위해 인공신경망 (ANN) 회귀분석, 분류분석을 적용했다. 분석법 구축을 위해, 2장) 근적외선 스펙트럼과 메타데이터를 이용한 회귀분석 및 검증, 3장) 질량분석 데이터와 메타데이터 간의 상관관계 회귀분석, 4장) 질량분석 데이터를 이용한 분류분석을 수행했다. 5장과 6장에서는 2 − 4장에서 최적화 및 구축한 분석법을 활용해 계절별로 수집된 메가시티 세 지역 울란바토르, 베이징, 서울 초미세먼지 시료를 분석해 지역 간 초미세먼지 데이터 비교 및 분류분석을 수행했다. 5장에서는 각 지역 초미세먼지 구성 특이 화학종 규명을 위해 겨울철 수집된 85개 시료, 340개 UPLC (-)APCI FT-ICR MS 데이터 (시료당 4반복 실험)와 초미세먼지 질량 농도의 ANN 회귀분석을 수행했다. UPLC (-)APCI FT-ICR MS 데이터 기반 ANN 회귀분석 결과, 지방족/지질 유래 유기 황산화물, 다환 방향족 유기 산화물이 울란바토르 초미세먼지 구성 화합물의 특징임을 알 수 있었다. 반면, 베이징과 서울에서는 지방족/지질 유래 유기 산화물이 초미세먼지 구성 주요 성분이었다. 또한, 지역 간 초미세먼지 구성 복합 유기성분 차이 해석을 위해 각 지역별 초미세먼지 질량 농도가 높은 9개 시료를 선정해 UPLC (-)APCI FT-ICR MS 데이터 기반 ANN 분류분석을 수행했다 (총 27개 시료, 108개 질량분석 데이터). 지방족/지질 유래 유기 황산화물과 다환 방향족 유기 산화물이 울란바토르 초미세먼지가 다른 두 지역과 구분되는 특이 화학종이었으며 울란바토르는 석탄/바이오매스 연소가 주 에너지원으로 미세먼지 발생 주요 오염원으로 확인되었다. 반면 베이징의 경우, 방향족 유기 질소산화물이 다른 지역과 구별할 수 있는 화학종으로 디젤 구동 대형 트럭과 버스의 배출가스가 베이징 미세먼지 발생 특정 오염원임을 알 수 있었다. 더불어, 베이징과 서울 초미세먼지는 지방족/지질 유래 산화물이 특징적인 화합물로 나타났으며, 이는 석유 연소 시 발생하는 대표 화학종이다. 6장에서는 계절에 따른 각 지역 초미세먼지 구성 복합 유기성분 차이 해석을 위해 여름/겨울별로 수집된 3개 메가시티 울란바토르, 베이징, 서울 초미세먼지 시료의 UPLC (-)APCI FT-ICR MS 데이터 기반 ANN 분류분석을 수행했다 (총 173개 시료, 692개 질량분석 데이터). 겨울철 초미세먼지에서 세 지역 모두 다환 방향족 유기 산화물이 특이 화학종으로 검출되었다. 더불어, 울란바토르 겨울철 초미세먼지는 지방족/지질 유래 유기 황산화물이 다른 지역과 구분되는 화합물로 나타났다. 반면 세 지역 여름철 초미세먼지 모두, 지방족/지질/리그닌/단백질 유래 유기 산화물이 겨울철 초미세먼지와 구분되는 특이 화학종으로 나타났다. 여름철 울란바토르 초미세먼지는 다환 방향족 유기 질소산화물, 여름철 서울 초미세먼지는 불포화 유기 질소산화물이 다른 지역과 차이가 나타나는 화합물로 나타났다. 종합적으로, 겨울철 초미세먼지는 석탄, 석유와 같이 연료 연소에 의한 발생 (다환 방향족 유기 화합물), 여름철 초미세먼지의 경우 자연 생태계 활동에 의한 발생 (지질, 리그닌, 단백질 유래 화합물)임을 알 수 있었으며 지역 특성에 따라 세부 차이가 나타남을 확인했다. 본 연구는 UPLC (-)APCI FT-ICR MS 및 ANN 분석을 기반으로 지역/계절에 따른 대기오염의 유기화학적 차이 분석에 중점을 두고 세 지역 초미세먼지의 구성 유기 화합물 및 발생원에 대한 포괄적인 이해를 제공했다. 이 연구는 ANN 모델을 대규모 초고분해능 질량분석 데이터세트에 적용한 최초의 사례이며 초미세먼지 간 복합 유기 화합물에 대해 분자 수준의 정보를 제공할 수 있다. 전반적으로, 이 연구는 대기오염을 줄이고 공중보건을 개선하기 위한 효과적인 전략 구상에 필수적인 동북아 초미세먼지 출처와 구성 및 2차 유기 에어로졸 발생에 대한 더 나은 이해에 기여할 것으로 기대한다.
Fine particulate matter (PM2.5, aerodynamic diameter ≤ 2.5 μm), which is generated and suspended in the air due to its small particle size, has a complex composition of organic, inorganic salts, and heavy metals. In addition, PM2.5 are generated by various factors (location, weather, temperature, hu...
Fine particulate matter (PM2.5, aerodynamic diameter ≤ 2.5 μm), which is generated and suspended in the air due to its small particle size, has a complex composition of organic, inorganic salts, and heavy metals. In addition, PM2.5 are generated by various factors (location, weather, temperature, humidity, etc.), so a large number of data are required for accurate data interpretation. Thus, the analysis of PM2.5 data, which requires complex mixtures and large-scale studies, is difficult to interpret. Therefore, in this study, an negative mode-Atmospheric pressure chemical ionization Fourier transform-ion cyclotron resonance mass spectrometer ((-)APCI FT-ICR MS) coupled with ultra performance liquid chromatography (UPLC) was used to investigate the differences in the complex organic components of PM2.5 by region and season, and artificial neural network (ANN) regression and classification analysis were applied for data interpretation. To build the methodology, Chapter 2. ANN regression analysis and validation using Visible/near-infrared (NIR) spectroscopy data and metadata, Chapter 3. correlation ANN regression analysis between mass spectrometry data and metadata, and Chapter 4. ANN classification analysis using mass spectrometry data were performed. In Chapters 5. and 6., the methods optimized and built in Chapters 2. to 4. were used to analyze seasonally collected PM2.5 samples from three megacities (Ulaanbaatar, Beijing, and Seoul), in order to compare and classify PM2.5 mass spectra across regions. In Chapter 5., the ANN regression analysis was performed on 85 PM2.5 samples collected during winter (total of 340 UPLC (-)APCI FT-ICR MS spectra with 4 replicates per sample) and PM2.5 mass concentrations to determine chemical specific to the composition of PM2.5 in each region. The ANN regression analysis based on UPLC (-)APCI FT-ICR MS data showed that aliphatic/lipid-derived organic sulfur oxides and polycyclic aromatic organic oxides characterized the compounds in Ulaanbaatar's PM2.5. In Beijing and Seoul, aliphatic/lipid-derived organic oxides were the major components of PM2.5. To further analyze the differences in PM2.5 composition between regions, nine samples with high PM2.5 mass concentrations in each region were selected and subjected to ANN classification analysis based on UPLC (-)APCI FT-ICR MS data (total of 27 PM2.5 samples, 108 UPLC (-)APCI FT-ICR MS spectra). Aliphatic/lipid-derived organic sulfur oxides and polycyclic aromatic organic oxides were the specific chemical species that distinguished Ulaanbaatar PM2.5 from the other two regions, and coal/biomass combustion was identified as the main source of PM2.5 in Ulaanbaatar. In contrast, aromatic organic nitrogen oxides were the chemical species that distinguished PM2.5 in Beijing from the other regions, and emissions from diesel-powered heavy-duty trucks and buses were the specific pollutant source of PM2.5 in Beijing. In addition, aliphatic/lipid-derived oxides were characteristic compounds in the Beijing and Seoul PM2.5, which are typical of chemical species produced by petroleum combustion. In Chapter 6., the ANN classification analysis based on UPLC (-)APCI FT-ICR MS data of PM2.5 samples from the three megacities of Ulaanbaatar, Beijing, and Seoul collected in summer and winter was performed to analyze the differences in the complex organic composition of PM2.5 in each region by season (total of 173 PM2.5 samples, 692 UPLC (-)APCI FT-ICR MS data). Polycyclic aromatic organic oxides were detected as specific chemical species in winter PM2.5 in all three regions. In addition, aliphatic/lipid-derived organic sulfur oxides were found to be a distinct compound in Ulaanbaatar winter PM2.5 compared to the other regions. In contrast, aliphatic/lipid/lignin/protein-derived organic oxides were found to be the distinctive chemical species in summer PM2.5 from all three regions. Polycyclic aromatic organic nitrogen oxides in summer PM2.5 from Ulaanbaatar and unsaturated organic nitrogen oxides in summer PM2.5 from Seoul were the compounds that differed from the other regions. Overall, it was confirmed that winter PM2.5 was generated by fuel combustion such as coal and petroleum (polycyclic aromatic organic compounds), and summer PM2.5 was generated by natural ecosystem activities (lipid, lignin, and protein-derived compounds), with detailed differences depending on regional characteristics. Based on UPLC (-)APCI FT-ICR MS and ANN analysis, this study provided a comprehensive understanding of the constituent organic compounds and sources of PM2.5 in the three regions, focusing on the analysis of organic chemical differences in air pollution by region/season. This study is the first to apply ANN models to large-scale ultrahigh resolution mass spectrometry datasets and can provide molecular-level information on complex organic compounds in PM2.5. Overall, this study is expected to contribute to a better understanding of the sources and composition of PM2.5 in Northeast Asia and the formation of secondary organic aerosols, which are essential for developing effective strategies to reduce air pollution and improve public health.
Fine particulate matter (PM2.5, aerodynamic diameter ≤ 2.5 μm), which is generated and suspended in the air due to its small particle size, has a complex composition of organic, inorganic salts, and heavy metals. In addition, PM2.5 are generated by various factors (location, weather, temperature, humidity, etc.), so a large number of data are required for accurate data interpretation. Thus, the analysis of PM2.5 data, which requires complex mixtures and large-scale studies, is difficult to interpret. Therefore, in this study, an negative mode-Atmospheric pressure chemical ionization Fourier transform-ion cyclotron resonance mass spectrometer ((-)APCI FT-ICR MS) coupled with ultra performance liquid chromatography (UPLC) was used to investigate the differences in the complex organic components of PM2.5 by region and season, and artificial neural network (ANN) regression and classification analysis were applied for data interpretation. To build the methodology, Chapter 2. ANN regression analysis and validation using Visible/near-infrared (NIR) spectroscopy data and metadata, Chapter 3. correlation ANN regression analysis between mass spectrometry data and metadata, and Chapter 4. ANN classification analysis using mass spectrometry data were performed. In Chapters 5. and 6., the methods optimized and built in Chapters 2. to 4. were used to analyze seasonally collected PM2.5 samples from three megacities (Ulaanbaatar, Beijing, and Seoul), in order to compare and classify PM2.5 mass spectra across regions. In Chapter 5., the ANN regression analysis was performed on 85 PM2.5 samples collected during winter (total of 340 UPLC (-)APCI FT-ICR MS spectra with 4 replicates per sample) and PM2.5 mass concentrations to determine chemical specific to the composition of PM2.5 in each region. The ANN regression analysis based on UPLC (-)APCI FT-ICR MS data showed that aliphatic/lipid-derived organic sulfur oxides and polycyclic aromatic organic oxides characterized the compounds in Ulaanbaatar's PM2.5. In Beijing and Seoul, aliphatic/lipid-derived organic oxides were the major components of PM2.5. To further analyze the differences in PM2.5 composition between regions, nine samples with high PM2.5 mass concentrations in each region were selected and subjected to ANN classification analysis based on UPLC (-)APCI FT-ICR MS data (total of 27 PM2.5 samples, 108 UPLC (-)APCI FT-ICR MS spectra). Aliphatic/lipid-derived organic sulfur oxides and polycyclic aromatic organic oxides were the specific chemical species that distinguished Ulaanbaatar PM2.5 from the other two regions, and coal/biomass combustion was identified as the main source of PM2.5 in Ulaanbaatar. In contrast, aromatic organic nitrogen oxides were the chemical species that distinguished PM2.5 in Beijing from the other regions, and emissions from diesel-powered heavy-duty trucks and buses were the specific pollutant source of PM2.5 in Beijing. In addition, aliphatic/lipid-derived oxides were characteristic compounds in the Beijing and Seoul PM2.5, which are typical of chemical species produced by petroleum combustion. In Chapter 6., the ANN classification analysis based on UPLC (-)APCI FT-ICR MS data of PM2.5 samples from the three megacities of Ulaanbaatar, Beijing, and Seoul collected in summer and winter was performed to analyze the differences in the complex organic composition of PM2.5 in each region by season (total of 173 PM2.5 samples, 692 UPLC (-)APCI FT-ICR MS data). Polycyclic aromatic organic oxides were detected as specific chemical species in winter PM2.5 in all three regions. In addition, aliphatic/lipid-derived organic sulfur oxides were found to be a distinct compound in Ulaanbaatar winter PM2.5 compared to the other regions. In contrast, aliphatic/lipid/lignin/protein-derived organic oxides were found to be the distinctive chemical species in summer PM2.5 from all three regions. Polycyclic aromatic organic nitrogen oxides in summer PM2.5 from Ulaanbaatar and unsaturated organic nitrogen oxides in summer PM2.5 from Seoul were the compounds that differed from the other regions. Overall, it was confirmed that winter PM2.5 was generated by fuel combustion such as coal and petroleum (polycyclic aromatic organic compounds), and summer PM2.5 was generated by natural ecosystem activities (lipid, lignin, and protein-derived compounds), with detailed differences depending on regional characteristics. Based on UPLC (-)APCI FT-ICR MS and ANN analysis, this study provided a comprehensive understanding of the constituent organic compounds and sources of PM2.5 in the three regions, focusing on the analysis of organic chemical differences in air pollution by region/season. This study is the first to apply ANN models to large-scale ultrahigh resolution mass spectrometry datasets and can provide molecular-level information on complex organic compounds in PM2.5. Overall, this study is expected to contribute to a better understanding of the sources and composition of PM2.5 in Northeast Asia and the formation of secondary organic aerosols, which are essential for developing effective strategies to reduce air pollution and improve public health.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.