Smiles String

使用SMILES字符串绘制化学式结构

SMILES string

相关网址:

简介

SMILES:Simplified molecular-input line-enty system SMILES 使用简短的ASCII 字符串描述化学结构式。 SMILES 字符串能够被分子编辑器转换为二维或三维的可视化分子结构

书写规则

Atoms and Bonds

SMILES支持元素周期表中的所有元素。原子必须使用各自的原子符号表示。 ​大写字母表示非芳香原子; ​ 小写字母表示芳香原子; ​ 如果原子拥有多个字母,则第二个字母必须小写。

Bonds书写规则:

  • - 单键

  • = 双键

  • # 三键

  • $ 四键

  • * 芳香键

  • . 断开的结构

    单键是默认的,因此不需要输入。举个例子:CC表示两个非芳香碳原子通过单键相连。计算机会将其识别为乙烷。

单链

​ 可以通过结合原子符号和键符号可以表示简单的链结构。

使用SMILES语法输入结构必须忽略氢。

SMILES自动识别原子可能的成键数。如果用户没能提供足够的成键信息,系统将自动假定其他连接为氢键。

Samples
CC CH3CH3 Ethane
C=C CH2CH2 Ethene
CBr CH3Br Bromomethane
C#N C三N Hydrocyanic acid
Na.Cl NaCl Sodium chloride

​ 用户可以指定系统识别氢键。如果在字符串中指定了氢键。SMILES解释器回家顶用户已经确定了分子的所有氢原子。 HC(H)=C(H)(H) Ethene

SMILES允许输入元素周期表中的所有的元素,并自动加氢,用户应当珠子带有两个字母的化学物,因为其可能会被计算机误解。举个例子:Sc可以编译为硫与芳香碳通过单键相连,也可被编译为钪元素。SMILES 解释器优先解释连接硫原子和芳香碳的单键。要识别钪,用户应输入 [Sc]

分支

​ 通过括号可以表示分支。括号中的字符串直接放在它所连接的原子的符号之后。如果它通过双键或三键连接,则键符号紧跟左括号。

Samples
CC(O)C 2-Propanol
CC(=O)C 2-Propanone
CC(CC)C 2-Methylbutane
CC(C)CC(=O) 2-Methylbutanal
c1c(N(=O)=O)cccc1 Nitrobenzene
CC(C)(C)CC 2,2-Dimethylbutane

SMILES允许用户使用数字定位开闭环原子来指定环结构。举个例子,环己烷C1CCCCC1,第一个碳原子数字标记1,它通过单键与最后一个碳(数字标记也为1)相连。可以对每个环使用不同数字来识别具有多个环的化学物。如果闭合环原子使用双键、单键或者芳香键相连,则键符号放置在闭合环编号之前。 ​如果需要两位数环号,则数字标记前面必须要有%C=1CCCCC1 Cyclohexene c1cc2ccccc2cc1 Naphthalene

带电原子

​ 识别带电原子的格式由原子后跟{ }组成,{ }括号内为原子上的电荷。可以明确说明电荷数量{-1}或不明确说明{-}

1
2
3
CCC(=O)O{-1}	Ionized form of propanoic acid
CCC(=O)O{-}
c1ccccn{+1}1CC(=O)O 1-Carboxylmethyl pyridinium

立体选择性

​ 双键周围的立体选择性由\/定义。 ​ 键方向符号总是以两个为一组。

举个例子: F/C=C/F表示反式-1,2-二氟乙烯一种可能,氟位于双键两侧 F/C=C\F表示顺式-1,2-二氟乙烯一种可能,氟位于双键一侧

​ 四面体碳构型由@@@指定