현재 온라인상에는 PubChem, ZINC, eMoecules등 다양한 화합물 구조 데이터베이스들이 있다. 화합물 구조 데이터베이스는 많은 수의 분자를 가지고 있고 각각 다양한 특성과 목적에 따라 구성 되어 있다. 또한 무료로 이용 가능하며 그 수는 늘어나고 있다. 그러나 이러한 데이터베이스들은 부정확한 Data의 존재, 3차원 구조정보의 결핍, 중복성의 문제 그리고 In Silico Drug Discovery Tools의 제공결여 등의 한계점을 가지고 있다. 어떤 데이터베이스는 2D 좌표 분자만을 가지고 있고, 중복된 분자의 정보를 포함하고 있으며, 하나의 분자가 다른 데이터베이스에서 각기 다른 ID로 불린다. 그러므로 이러한 분자 데이터를 사용하기 전에 처리하고 통합해야 할 필요가 있다. 화합물 데이터베이스를 통합할 때, 중복된 분자는 제거되어야 한다. 분자 데이터를 통합 할 때, 분자의 Descriptor 정보와 각 데이터베이스에서 제공하는 정보들은 유지되어야 한다. 분자간의 중복 여부를 조사하기 위해 분자를 1차원 문자열로 나타내주는 방법인 yaInChI (modified InChI String)를 이용한다. 0D 혹은 2D 좌표로 이루어진 분자는 TDG(Three Dimension Generator)와 Energy Minimize 과정을 통해 구조적으로 안정화되는 과정을 거친다. 여러 화합물 구조 데이터베이스로부터 1억 개 이상의 분자 구조를 얻고 이를 통합하여 약 4천만 개 이상의 유일분자 구조를 얻었다. 분자의 데이터는 관리와 검색의 편리성을 위하여 mySQL을 이용하여 데이터베이스화 되었고, 이렇게 통합된 화합물 구조 데이터베이스를 Chem3DB라고 부른다. Chem3DB는 분자 데이터의 관리와 검색이 용이하고 In Silico Drug Discovery Tool을 이용하는데 있어서 편리함을 주고 http://ebio.ssu.ac.kr/Chem3DB/에서 자유롭게 이용가능하며 Chrome Browser에 ...
현재 온라인상에는 PubChem, ZINC, eMoecules등 다양한 화합물 구조 데이터베이스들이 있다. 화합물 구조 데이터베이스는 많은 수의 분자를 가지고 있고 각각 다양한 특성과 목적에 따라 구성 되어 있다. 또한 무료로 이용 가능하며 그 수는 늘어나고 있다. 그러나 이러한 데이터베이스들은 부정확한 Data의 존재, 3차원 구조정보의 결핍, 중복성의 문제 그리고 In Silico Drug Discovery Tools의 제공결여 등의 한계점을 가지고 있다. 어떤 데이터베이스는 2D 좌표 분자만을 가지고 있고, 중복된 분자의 정보를 포함하고 있으며, 하나의 분자가 다른 데이터베이스에서 각기 다른 ID로 불린다. 그러므로 이러한 분자 데이터를 사용하기 전에 처리하고 통합해야 할 필요가 있다. 화합물 데이터베이스를 통합할 때, 중복된 분자는 제거되어야 한다. 분자 데이터를 통합 할 때, 분자의 Descriptor 정보와 각 데이터베이스에서 제공하는 정보들은 유지되어야 한다. 분자간의 중복 여부를 조사하기 위해 분자를 1차원 문자열로 나타내주는 방법인 yaInChI (modified InChI String)를 이용한다. 0D 혹은 2D 좌표로 이루어진 분자는 TDG(Three Dimension Generator)와 Energy Minimize 과정을 통해 구조적으로 안정화되는 과정을 거친다. 여러 화합물 구조 데이터베이스로부터 1억 개 이상의 분자 구조를 얻고 이를 통합하여 약 4천만 개 이상의 유일분자 구조를 얻었다. 분자의 데이터는 관리와 검색의 편리성을 위하여 mySQL을 이용하여 데이터베이스화 되었고, 이렇게 통합된 화합물 구조 데이터베이스를 Chem3DB라고 부른다. Chem3DB는 분자 데이터의 관리와 검색이 용이하고 In Silico Drug Discovery Tool을 이용하는데 있어서 편리함을 주고 http://ebio.ssu.ac.kr/Chem3DB/에서 자유롭게 이용가능하며 Chrome Browser에 최적화 되어 있다.
현재 온라인상에는 PubChem, ZINC, eMoecules등 다양한 화합물 구조 데이터베이스들이 있다. 화합물 구조 데이터베이스는 많은 수의 분자를 가지고 있고 각각 다양한 특성과 목적에 따라 구성 되어 있다. 또한 무료로 이용 가능하며 그 수는 늘어나고 있다. 그러나 이러한 데이터베이스들은 부정확한 Data의 존재, 3차원 구조정보의 결핍, 중복성의 문제 그리고 In Silico Drug Discovery Tools의 제공결여 등의 한계점을 가지고 있다. 어떤 데이터베이스는 2D 좌표 분자만을 가지고 있고, 중복된 분자의 정보를 포함하고 있으며, 하나의 분자가 다른 데이터베이스에서 각기 다른 ID로 불린다. 그러므로 이러한 분자 데이터를 사용하기 전에 처리하고 통합해야 할 필요가 있다. 화합물 데이터베이스를 통합할 때, 중복된 분자는 제거되어야 한다. 분자 데이터를 통합 할 때, 분자의 Descriptor 정보와 각 데이터베이스에서 제공하는 정보들은 유지되어야 한다. 분자간의 중복 여부를 조사하기 위해 분자를 1차원 문자열로 나타내주는 방법인 yaInChI (modified InChI String)를 이용한다. 0D 혹은 2D 좌표로 이루어진 분자는 TDG(Three Dimension Generator)와 Energy Minimize 과정을 통해 구조적으로 안정화되는 과정을 거친다. 여러 화합물 구조 데이터베이스로부터 1억 개 이상의 분자 구조를 얻고 이를 통합하여 약 4천만 개 이상의 유일분자 구조를 얻었다. 분자의 데이터는 관리와 검색의 편리성을 위하여 mySQL을 이용하여 데이터베이스화 되었고, 이렇게 통합된 화합물 구조 데이터베이스를 Chem3DB라고 부른다. Chem3DB는 분자 데이터의 관리와 검색이 용이하고 In Silico Drug Discovery Tool을 이용하는데 있어서 편리함을 주고 http://ebio.ssu.ac.kr/Chem3DB/에서 자유롭게 이용가능하며 Chrome Browser에 최적화 되어 있다.
Currently, there are various chemical structure databases, such as PubChem, ZINC, eMolecules, etc. These DBs have been constructed for various purposes and goals. Each chemical molecular DB contains huge number of molecules and the entries are increasing. However, these DBs have also limitations. So...
Currently, there are various chemical structure databases, such as PubChem, ZINC, eMolecules, etc. These DBs have been constructed for various purposes and goals. Each chemical molecular DB contains huge number of molecules and the entries are increasing. However, these DBs have also limitations. Some chemical DBs has only 2D information for molecular coordinates. Also, these DBs have redundant contents and there are duplicated molecules among DBs. In some cases, the same molecules are called in different ID or name among different DBs or even in the same DB. Therefore, these DBs need pre-process before used for drug discovery. Controlling and integration of chemical DBs have been a major interest in chemistry and its related field. In the integration process, only unique data must be added to the new unique DB by duplication check. yaInChI, modified InChI string, is used for duplication check. And molecules have 2D coordinates are minimized structurally through a series of energy minimization steps. At this time, additional information of each molecule, such as molecular descriptor and molecular information from each DB are calculated and transferred to the new unique DB. The current version of the database contains approximately 40 million compounds. As a result, integrated chemical molecular database is unique and contains 3D molecular structures, and all information from other DBs are inherited and well organized with mySQL. We Describe Chem3DB, integration of database of molecules available on the Web. The database includes a user-friendly graphical interface, virtual compound generator, clustering, as well as easily search capabilities. Chem3DB is freely accessible at http://ebio.ssu.ac.kr/Chem3DB/. It is comfortable at Chrome Browser.
Currently, there are various chemical structure databases, such as PubChem, ZINC, eMolecules, etc. These DBs have been constructed for various purposes and goals. Each chemical molecular DB contains huge number of molecules and the entries are increasing. However, these DBs have also limitations. Some chemical DBs has only 2D information for molecular coordinates. Also, these DBs have redundant contents and there are duplicated molecules among DBs. In some cases, the same molecules are called in different ID or name among different DBs or even in the same DB. Therefore, these DBs need pre-process before used for drug discovery. Controlling and integration of chemical DBs have been a major interest in chemistry and its related field. In the integration process, only unique data must be added to the new unique DB by duplication check. yaInChI, modified InChI string, is used for duplication check. And molecules have 2D coordinates are minimized structurally through a series of energy minimization steps. At this time, additional information of each molecule, such as molecular descriptor and molecular information from each DB are calculated and transferred to the new unique DB. The current version of the database contains approximately 40 million compounds. As a result, integrated chemical molecular database is unique and contains 3D molecular structures, and all information from other DBs are inherited and well organized with mySQL. We Describe Chem3DB, integration of database of molecules available on the Web. The database includes a user-friendly graphical interface, virtual compound generator, clustering, as well as easily search capabilities. Chem3DB is freely accessible at http://ebio.ssu.ac.kr/Chem3DB/. It is comfortable at Chrome Browser.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.