使用SMILES字符串绘制化学式结构
SMILES string
相关网址:
简介
SMILES:Simplified molecular-input line-enty system SMILES 使用简短的ASCII 字符串描述化学结构式。 SMILES 字符串能够被分子编辑器转换为二维或三维的可视化分子结构
书写规则
Atoms and Bonds
SMILES支持元素周期表中的所有元素。原子必须使用各自的原子符号表示。 大写字母表示非芳香原子; 小写字母表示芳香原子; 如果原子拥有多个字母,则第二个字母必须小写。
Bonds书写规则:
-
单键=
双键#
三键$
四键*
芳香键.
断开的结构单键是默认的,因此不需要输入。举个例子:
CC
表示两个非芳香碳原子通过单键相连。计算机会将其识别为乙烷。
单链
可以通过结合原子符号和键符号可以表示简单的链结构。
使用SMILES语法输入结构必须忽略氢。
SMILES自动识别原子可能的成键数。如果用户没能提供足够的成键信息,系统将自动假定其他连接为氢键。
Samples | ||
---|---|---|
CC | CH3CH3 | Ethane |
C=C | CH2CH2 | Ethene |
CBr | CH3Br | Bromomethane |
C#N | C三N | Hydrocyanic acid |
Na.Cl | NaCl | Sodium chloride |
用户可以指定系统识别氢键。如果在字符串中指定了氢键。SMILES解释器回家顶用户已经确定了分子的所有氢原子。
HC(H)=C(H)(H) Ethene
SMILES允许输入元素周期表中的所有的元素,并自动加氢,用户应当珠子带有两个字母的化学物,因为其可能会被计算机误解。举个例子:Sc可以编译为硫与芳香碳通过单键相连,也可被编译为钪元素。SMILES
解释器优先解释连接硫原子和芳香碳的单键。要识别钪,用户应输入
[Sc]
。
分支
通过括号可以表示分支。括号中的字符串直接放在它所连接的原子的符号之后。如果它通过双键或三键连接,则键符号紧跟左括号。
Samples | |
---|---|
CC(O)C | 2-Propanol |
CC(=O)C | 2-Propanone |
CC(CC)C | 2-Methylbutane |
CC(C)CC(=O) | 2-Methylbutanal |
c1c(N(=O)=O)cccc1 | Nitrobenzene |
CC(C)(C)CC | 2,2-Dimethylbutane |
环
SMILES允许用户使用数字定位开闭环原子来指定环结构。举个例子,环己烷C1CCCCC1
,第一个碳原子数字标记1,它通过单键与最后一个碳(数字标记也为1)相连。可以对每个环使用不同数字来识别具有多个环的化学物。如果闭合环原子使用双键、单键或者芳香键相连,则键符号放置在闭合环编号之前。
如果需要两位数环号,则数字标记前面必须要有%
。
C=1CCCCC1 Cyclohexene
c1cc2ccccc2cc1 Naphthalene
带电原子
识别带电原子的格式由原子后跟{ }组成,{
}括号内为原子上的电荷。可以明确说明电荷数量{-1}
或不明确说明{-}
1 | CCC(=O)O{-1} Ionized form of propanoic acid |
立体选择性
双键周围的立体选择性由\
和/
定义。
键方向符号总是以两个为一组。
举个例子:
F/C=C/F
表示反式-1,2-二氟乙烯一种可能,氟位于双键两侧
F/C=C\F
表示顺式-1,2-二氟乙烯一种可能,氟位于双键一侧
四面体碳构型由@
或@@
指定