Publications of the University of Eastern Finland Dissertations in Health Sciences
isbn 978-952-61-0836-0
Publications of the University of Eastern Finland Dissertations in Health Sciences
sertations | 120 | Jussi Paananen | Bioinformatic Approaches for Integration of Genomic Information
Jussi Paananen Bioinformatic Approaches for Integration of Genomic
Information Jussi Paananen
Bioinformatic Approaches for
Integration of Genomic Information
The present study provides new bioinformatics methods and software tools for integration of genomic information. These novel methods and tools enable researchers to combine, analyze and visualize data from scientific experiments conducted with different biomedical research technologies, including genetic, transcriptomic, proteomic, metabolomic and epigenetic studies.
The ability to integrate genomic information allows researchers to discover novel findings, helps with relating experimental results between species and technologies, and provides cost-effective and ethical solutions through reuse of data.
JUSSI PAANANEN
---
---
- -
`
`
`
`
`
*` `+- . )/ `4`+ -($..$*)`*!`/# `0'/4`*!` '/#`$ ) .O`)$1 -.$/4`*!`
./ -)`$)')`!*-`+0'$` 3($)/$*)`$)`0$/*-$0(`DO` $./0$`
0$'$)"O`0*+$*O`*)`-$4O`0'4`H/#`DBCDO`/`CD`)**)`
`
`
0'$/$*).`*!`/# `)$1 -.$/4`*!`./ -)`$)')`
`$.. -//$*).`$)` '/#`$ ) .``
CDB`
`
`
+-/( )/`*!` 0-*$*'*"4O`N N`$-/) )` )./$/0/ O`0'/4`*!` '/#`$ ) .O`
)$1 -.$/4`*!`./ -)`$)')`
0*+$*`
DBCD
-
`
`
`
`
`
`
`
`
`
`
`
`
`
*+$%417`4`
0*+$*O`DBCD`
$)')`
`
-$ .`$/*-.P``
-*! ..*-` '$]//$`*.(O`NNO`#NN`
)./$/0/ `*!`'$)$'` $$) O`/#*'*"4`
0'/4`*!` '/#`$ ) .`
`
-*! ..*-`)) ' `0-0) )O`#NN`
+-/( )/`*!`0-.$)"`$ ) ` 0'/4`*!` '/#`$ ) .`
`
-*! ..*-`''$`-?#)O`#NN`
N N`$-/) )` )./$/0/ `!*-`*' 0'-`$ ) .`
0'/4`*!` '/#`$ ) .`
`
$./-$0/*-P``
)$1 -.$/4`*!`./ -)`$)')`
0*+$*`(+0.`$--4`
NN*3`CHDI`
]IBDCC`0*+$*O`$)')`
#//+P\\222N0 !N!$\&$-%./*`
`
`S+-$)/TP`KIJ]KGD]HC]BJEH]B`
`S+!TP`KIJ]KGD]HC]BJEI]I`
`S+-$)/TP`CIKJ]GIBH`
`S+!TP`KIJ]KGD]HC]BJEI]I`
]P`CIKJ]GIBH
III
0/#*-X.`- ..P` )./$/0/ `*!`'$)$'` $$) \#**'`*!` $$) ` )$1 -.$/4`*!`./ -)`$)')`
` `
`
0+ -1$.*-.P` -*! ..*-`--4`*)"O`#NN`
+-/( )/`*!` 0-*$*'*"4\N N`$-/) )` )./$/0/ `!*-`
*' 0'-`$ ) .``
)$1 -.$/4`*!`./ -)`$)')`
` `
`
-&0.`/*-1$&O`#NN`
#-(*'*"4\#**'`*!`#-(4`
)$1 -.$/4`*!`./ -)`$)')`
` `
`
1$ 2 -.P` -*! ..*-`0)*`$#$) )O`#NN`
+-/( )/`*!`3+ -$( )/'` $'`$ ) ` 0)`)$1 -.$/4`
`
`
`
-*0/`)" -`$%`*-+ '$) )O`#NN`
`_` ` )/ -`!*-`$ ) `
` `
`
++*) )/P` * )/`#-$./*+# `**.O`#NN`
` +-/( )/`*!`$")'`-* ..$)"`
` (+ - ` #)$'`)$1 -.$/4`
` `
` `
`
`
`
V
)) )O`0..$`
$*$)!*-(/$`++-*# .`!*-` )/ "-/$*)`*!` )*($` )!*-(/$*)O`FE`+N`
)$1 -.$/4`*!`./ -)`$)')O`0'/4`*!` '/#`$ ) .O`DBCD`
0'$/$*).`*!`/# `)$1 -.$/4`*!`./ -)`$)')N`$.. -//$*).`$)` '/#`$ ) .`CDBN`
DBCDN`FE`+N`
`
`S+-$)/TP`KIJ]KGD]HC]BJEH]B`
`S+!TP`KIJ]KGD]HC]BJEI]I`
`S+-$)/TP`CIKJ]GIBH`
`S+!TP`KIJ]KGD]HC]BJEI]I`
]P`CIKJ]GIBH`
`
ABSTRACT
)*($` $)!*-(/$*)` !*-(.` /# ` .$.` *!` (* -)` $*( $'` )`
$*/ #)*'*"$'`- . -#N` )/ -+- /$)"`/#$.`$)!*-(/$*)`$.``-0$'`./ +`$)`
*- -` /*` 0) -./)` $!! - )/` .+ /.` *!` '$! ` )` $*'*"4O` .` 2 ''` .` $)`
1 '*+$)"` )*1 '` /- /( )/.` *-` $*/ #)*'*"$'` +-*0/.N` ) ` *!` /# ` (*./`$(+*-/)/`.+ /.`*!`$)/ -+- /$)"`" )*($`$)!*-(/$*)`$.`/# `$'$/4`
/*` *($) ` )` %*$)/'4` )'45 ` $)!*-(/$*)` !-*(` 1-$*0.` .*0- .O`
$)'0$)"` 3+ -$( )/.` + -!*-( ` *)` $!! - )/` .+ $ .O` / #)*'*"$ .` *-`
' 1 '.` *!` " )*($` $)!*-(/$*)O` .0#` .` " ) /$.O` /-).-$+/*($.O`
+-*/ *($.O`( /*'*($.`*-` +$" ) /$.N`
*`# '+`- . -# -.`#-) ..`/# `!0''`+*/ )/$'`*!`" )*($`$)!*-(/$*)O`
2 `#1 ` 1 '*+ `)*1 '`$*$)!*-(/$.`( /#*.`)`.*!/2- `/**'.`/#/`
)` ` 0. ` /*` $)/ "-/ O` 1$.0'$5 ` )` )'45 ` " )*($` /N` # . `
$)'0 ``2 ]. `/**'`!*-`$)/ "-/$)"`/`!*-`*(+ )$0(`./0$ .O``
.*!/2- ` /**'` !*-` E]` 1$.0'$5/$*)` *!` " )*($` /O` )` ` #0()`
1-$/$*)`/. `+*-/'N`# . `( /#*.`)`/**'.`''*2`- . -# -.`/*`
!!$$ )/'4` +-* ..` '-" ` (*0)/.` *!` /` !-*(` " )*($` 3+ -$( )/.O`
)'$)"` /# (` /*` (& ` )*1 '` $.*1 -$ .` )` #4+*/# . .N` )` $/$*)O`
. `./0$ .` (*)./-/$)"`/# . `/**'.`- `+- . )/ N``
#$.`/# .$.`'.*` .-$ .`)`$.0.. .`/# `- .*).`)`#'' )" .`*!`
$)/ "-/$*)` *!` " )*($` $)!*-(/$*)O` 2#$' ` '.*` ./$)"` '$"#/` *)` /# ` 0-- )/`.// `*!`/# `!$ '`/*" /# -`2$/#``- 1$ 2`*!`/# ` 3$./$)"`( /#*.`
)`/**'.`!*-`" )*($`/`$)/ "-/$*)N``
`
/$*)'`$--4`*!` $'`'..$!$/$*)P``DHNGO``FIBO``GJNGO``DHNGGN F`
$'` 0% /` $)".P` $*$)!*-(/$.Q` *(+0//$*)'` $*'*"4Q` /. Q` /`
#-$)"Q` ) /$.Q` )*($.Q` )*($`/-0/0-'`-$/$*)Q`//$./$'`/`)'4.$.`
`
` `
VII
)) )`0..$`
$*$)!*-(/$$&)`( ) / '($7`" )*($. )`/$ *)`$)/ "-*$)/$$)O`FE`.N`
/7]0*( )`4'$*+$./*O`/ -1 4./$ / $ )`/$ &0)/O`DBCD`
0'$/$*).`*!`/# `)$1 -.$/4`*!`./ -)`$)')N`$.. -//$*).`$)` '/#`$ ) .`CDBN`
DBCDN`FE`.N`
`
`S+-$)/TP`KIJ]KGD]HC]BJEH]B`
`S+!TP`KIJ]KGD]HC]BJEI]I`
`S+-$)/TP`CIKJ]GIBH`
`S+!TP`KIJ]KGD]HC]BJEI]I`
]P`CIKJ]GIBH`
`
TIIVISTELMÄ
)*($) )` /$ /*` *)` *' ''$) )` *.` )4&4$&$./` $*'77& /$ / ''$./7`
/0/&$(0./N` 7(7)` /$ *)` /0'&$/. ($) )` *)` /7-& 77` /0/&$%*$'' O` %*/&`
+4-&$17/`4((7-/7(77)`$*'*"$`%` '7(77O`.(*$)`&0$)`/0/&$%*$'' O`%*/&`
& #$//717/`00.$`#*$/*(0*/*%`/$`$*/ &)$.$7`/0*// $/N`&.$`/7-& $(($./7`
" )*($. )`/$ *)`/0'&$/. ($. )`& $)*$./`*)`&4&4`4#$./77`%`)'4.*$`
/$ /*` -$` '7#/ $./7N` 7$/7` '7#/ $/7` *1/` -$` '% $''` . &7` / &)*'*"$*$''`
/ #4/` /0/&$(0&. /O` &0/ )` .$( -&$&.$` " ) //$. /O` /-).&-$+/*($. /O`
+-*/ *($. /O`( /*'*($. /`%` +$" ) //$. /`&*& /N`
0//&. (( ` /0/&$%*$/` #4?4)/7(77)` " )*($./` /$ /*O` *' (( `
& #$//7) /` 00.$` $*$)!*-(/$$&)` ( ) / '($7` %` *#% '($./*%O` %*$/`
1*$)` &74//77` " )*($. )` /)` 4#$./7($. )O` 1$.0'$.*$)/$$)` %`
)'4.*$)/$$)N` 7(7` 00 /` ( ) / '(7/` %` *#% '($./*/` .$.7'/717/` $#($. )`
" ) //$./7` 1$#/ '0` &011)` /$ /*&)))` . &7` /4?&'0%` " )*($. )`
/0/&$(0./)` $)/ "-*$)/$$)` %` &*'($0'*// $. )` 1$.0'$.*$)/$$)N` 4. $. /`
( ) / '(7/` %` *#% '($./*/` (#*''$./1/` '%*% )` " )*($./ )` /]
$) $./*% )` &7.$// '4)` %` )'4.*$))$)O` 0// )` $*]` %` '77& /$ / )`
/0/&$%*$/` / & (77)` 00.$` '?4?&.$7` %` #4+*/ . %N` *-$)` *# ''`
17$/?.&$-%..` .$/ ''77)` & #$/ //4%7` ( ) / '($7` %` *#% '($./*%`
/+0./0/&$(0./ )`10''N`
0.$ )`( ) / '($ )`%`*#% '($./*% )`'$.7&.$`/7(7`17$/?.&$-%`&01`%`
-1$*$`" )*($. )`/$ *)`$)/ "-*$)/$$)`'$$//41$7`.4$/7`%`#./ $/O`.(''`
/-&./ '' )`*' (..`*' 1$ )`( ) / '($ )`%`/4?&'0% )`)4&4/$'N`
`
0*&$/0.P``DHNGO``FIBO``GJNGO``DHNGGN F`
' $) )` 0*('$) )` .$.)./*P` $*$)!*-(/$$&&O` " )*($$&&O` $)/ "-*$)/$O`
+ -$))?''$.44./$ O`/$ /*O`/$ *)'*0#$)/O`/$ /*% )&7.$// '4/$ / /` `
`
` `
IX
`
# ` 2*-&` +- . )/ ` $)` /#$.` /# .$.` #.` )` --$ ` *0/` $)` 1-$*0.`
'*/$*).` 0-$)"` /# ` 4 -.` DBBF]DBCDN` # ` 2*-&` #.` )` .+*-$O`
./-/$)"` 2$/#` (..$1 ` .+ O` )` .'*2$)"` /*` '(*./` ` *(+' / ` #'/`
!*- ` .0 )'4` $)"` !$)$.# ` /*` 1 -4*) X.` (5 ( )/` /#$.` 4 -N`
0-$)"` /#$.` /$( O` )` )*-(*0.` (*0)/` *!` + *+' ` #1 ` # '+ ` )`
*)/-$0/ `/*`/#$.`2*-&O`.*( ` 1 )`+*.$/$1 '4O`)` `..0( `/#/`/#$.`$.`
*) `*!`/# `/$( .`)` +' .` 2# - ` `.#*0'` ./*+` )` &)*2' " ` 4*0`
S)`/`/# `.( `/$( `..0- `4*0`/#/`$/`2*)X/` `/# `'./`/$( `*-`+' TN``
` *2 ` /# ` + ./` "-/$/0 ` /*` (4` +-$)$+'` .0+ -1$.*-O` -*! ..*-`
--4` *)"O` 2#*` .$ .` "$1$)"` ( ` ` %*` &` $)` /# ` 4O` /0"#/` ( ` 2#/`.$ ) `$.O`)`#.` )``"- /`!-$ )`)`( )/*-`/#-*0"#`''`/# . ` 4 -.N`--4`#.` )``"- /`$)!'0 ) `/*`#*2` `1$ 2`'$! O`.$ ) O`)`
2$) N`
4`*/# -`.0+ -1$.*-O`%0)/`+-*! ..*-`-&0.`/*-1$&O` . -1 .`(4`
"-/$/0 ` !*-` )*/` #$) -$)"` (4` 2*-&` 2$/#` /#$.` /# .$.O` )` !*-` #$.`
$).$"#/!0'`*(( )/.`)`! &`S(*./'4`*) -)$)"`*-"( .TN`
`2*0'`'$& `/*`/#)&`''`(4`*]0/#*-.`2#*`*)/-$0/ `/*`/# `2*-&`
+- . )/ ` $)` /#$.` /# .$.N` *` .$ .` --4` )` -&0.O` /#)&.` "*` /*`
* -/`$.5 &N`
0-$)"`/# `4 -.`/#$.`/# .$.`#.` )`$)`+- +-/$*)O` `#1 `2*-& `/`
. 1 -'`+' .N`4``,0$&` ./$(/ O`0-$)"`/#*. `4 -.O` `#1 `#`*1 -`
DBB`*'' "0 .`2*-&$)"`$)`/# `.( `- . -#`"-*0+.`2$/#`( N`` 0. ` `
*` )*/` 2)/` /*` *!! )` )4` *!` /# (` 4` ' 1$)"` /# (` *0/` !-*(`
&)*2' " ( )/.` )` 0. ` ` (` .0- ` /#/` ` 2*0'` ($..` . 1 -'`
+ *+' `2#*` . -1 `(4`"-/$/0 O` `2$''`-/# -`#**. `/*`*!! )`''`)`
1 -4*) `*!`4*0O`)`2$''`%0./`.$(+'4`/#)&` 1 -4*) `2#*`#.`2*-& ` 2$/#` ( ` /` /# ` - . -#` "-*0+.` *!` -*! ..*-` --4` *)"O` (4`
-*! ..*-` -&&0` &.*O` -*! ..*-` //$` 0.$/0+O` /` /# ` -*`
)./$/0/ `*!` `)`-1-O`)`/`/# `1-$*0.`*/# -`"-*0+.`/#/` `#1 `
*''*-/ `)`2*-& `2$/#N`
.$ .`*'' "0 .O`(4` )' ..`"-/$/0 ` '*)".`/*`(4`!-$ ).O`2#*`
#1 ` # '+ ` ( ` 2$/#` 1-$*0.` .$ )/$!$` )` )*)].$ )/$!$` $..0 .` 0-$)"`
/# ` 4 -.N` *( /$( .` /# ` (*./` /-$1$'` # '+O` ,0 ./$*).` *-` 4 ''$)"` #1 `
# '+ `( `/*`+0.#`!*-2-`2$/#`/#$.`/# .$.`S)`'$! `$)`" ) -'TN`*/`/*`
( )/$*)`/# `)*)]/-$1$'`*.$*).N`
./`)`(*./`$(+*-/)/'4O` `2)/`/*`/#)&`(4`!($'4N``#)&`4*0`!*-`
# '+$)"` ( ` /*` +0/` /#$)".` $)/*` + -.+ /$1 ` )` /*` - ( ( -` #*2`
0)$(+*-/)/`)`.$''4`/# . .`- N`)`/#)&`4*0`!*-`1 -4/#$)"` '. `.`
2 ''N`
)` ++- $/$*)` *!` /# ` !$))$'` .0++*-/` +-*1$ ` !*-` /# ` 2*-&`
+- . )/ `$)`/#$.`/# .$.O` `2*0'`'$& `/*`/#)&`/# ` (4`*!`$)')O`
./(*$) )` *0)/$*)O` 0'-$"#/` -*"-(O` )./-0( )/-$0(`
*0)/$*)O` '1$` *0)/$*)O` # ` 0*+$*` /0-'$./.X` *$ /4O`
)$1 -.$/4` *!` ./ -)` $)')` STO` */*-'` -*"-(` *!` *' 0'-`
$$) \O` )$1 -.$/4` *!` 0*+$*` STO` -0/ ` #**'` *!`
*' 0'-` $$) \O`)`0#` &7'7$) )N`
`
0*+$*O`0) `DBCDN`
XI
$./`*!`/# `*-$"$)'`+0'$/$*).``
-
#$.`$.. -//$*)`$.`. `*)`/# `!*''*2$)"`*-$"$)'`+0'$/$*).P``
`
###@O`*)"`P` )/ "-/$*)`*!`" )*($`/`!*-`
+#-(*'*"4`)`/*3$*'*"4`0.$)"` )/ -) /`- .*0- .N``
`)1$-*)` .N`DBBH` QCISCTPDG]EHN``
`
###@O`/*-1$&`O`*)"`P`P``( /" ) ` - /*-`- .*0- `!*-`-*..]+'/!*-(`)`-*..].+ $ .`
*(+ )$0(`./0$ .O``$*$)!*-(/$.N`DBBH` +`DDQIPFCJN`
`
###@O`*)"`P`EP`!*- ]$- / `E`"-+#` $/*-`
!*-`1$.0'$5/$*)`*!`$)/ "-/ `" )*( `.' `/O``4./ (.`
$*'*"4N`DBBK` `DFQEPDHN`
`
###@O`$.5 &`O`*)"`P`-$ /.P``!0)/$*)'`1-$/$*)`
/. `+*-/'O`/. `S3!*-TN`DBCB`0'`DKQDBCBN`
# ` +0'$/$*).` 2 - ` - +-$)/ ` 2$/#` /# ` + -($..$*)` *!` /# ` *+4-$"#/`
*2) -.N`
`
`
XIII
` -
0 @::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@0 1 @ @::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@2 DNC `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`F DND `` `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`G DNE `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`H DNF `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`I DNG `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`J DNH `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`J DNI `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`K
2 @ @ @:::::::::::::::::::::::::::::::::::@0/
ENC `` ` `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`CB END `` ` `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`CC 3 @:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@04 4 @@@::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@05 GNC ] ``` `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`CH GND ] ``NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`CI GNE ] ``NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`CJ GNF ```NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`CK GNG ``NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`DB 5 @:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@10 HNC `` ```NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`DC HND ] ``]`` `NNNNNNNNNNNNNNNNNNNNNNNNNNN`DE HNE `` ` ``NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`DF HNF ```` ` `NNNNNNNNNNNNNNNNNNNNNNNNNNNN`DI HNG ``NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`DJ 6 @:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@18 INC `` ` `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`DK IND `` `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`DK
INE ` `NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN`EB 7 @:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@21
@:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::@22
<@ @ @= ? >
` `
XV
- 1$/$*).`
`
` ++'$/$*)`
+-*"-(($)"`
$)/ -! `
` *(+' ( )/-4`
*34-$*)0' $`
$`
` *((*)` "/ 24`
$)/ -! ``
# ` #-*(/$)` $((0)*]
+- $+$//$*)`
# ]. ,` #-*(/$)` $((0)*]
+- $+$//$*)`
. ,0 )$)"`
` *+4` )0( -`
1-$)/`
+!` (/* `
$).0'$)\"-*2/#`
!/*-`- +/*-`" ) `
` *34-$*)0' $`
$`
` 0-*+ )`
$*$)!*-(/$.`
)./$/0/ `
` 3+- ..$*)`
,0)/$//$1 `/-$/`'*$`
]. ,` *-(' #4 ]
..$./ ` $.*'/$*)` *!`
- "0'/*-4` ' ( )/.`
*0+' ` 2$/#` #$"#]
/#-*0"#+0/`
. ,0 )$)"`
` ) ` 3+- ..$*)`
()$0.`
` ) ` . /` )-$#( )/`
)'4.$.`
` -+#$'` 0. -`
$)/ -! `
` )*( ]2$ `
..*$/$*)`./04`
` $"#]*)/ )/`
)'4.$.`
` # ` ` ) `
*( )'/0- `
*(($// `
` 0()` )*( `
-*% /`
` 0()` )*( `
-")$5/$*)`
` )/ "-/$1 `
)*($.`$ 2 -``
` )/ -)/$*)'` -*/ $)`
) 3`
` )/ -) /` '4`#/`
` 4*/*` )4'*+ $`
*!` ) .` )`
)*( .`
]` $,0$`
#-*(/*"-+#4]
(..`.+ /-*( /-4`
` $! ` $ ) `
)/$!$ -``
` *0.` ! - ) `
)*($`
` $)$(0(`
)!*-(/$*)` *0/` `
$-*--4`
3+ -$( )/``
($` $-*` -$*)0' $`
$`
(` ` .. )" -`
-$*)0' $`$`
` 0' -` (") /$`
- .*)) `
` /$*)'` )/ -` !*-`
$*/ #)*'*"4`
)!*-(/$*)`
+- ](` - 0-.*-` ( .. )" -`
-$*)0' $`$`
` .*0- `
.-$+/$*)`
-( 2*-&``
` $*)0' $`$`
$` $*)0' $` $`
$)/ -! - ) `
]. ,` $*)0' $` $`
. ,0 )$)"`
.$` (''` $)/ -! -$)"`
-$*)0' $`$`
` $)"' ` )0' */$ ` +*'4(*-+#$.(`
` '!]*-")$5$)"`(+`
` )$1 -.$/4` *!`
'$!*-)$O` )/`
-05`
` *-'`$ ` ``
`
`
`
-
)*($` $)!*-(/$*)` !*-(.` /# ` .$.` *!` (* -)` $*/ #)*'*"4` )`
$*( $'`- . -#N` )`/# $-`,0 ./`!*-`.*'1$)"`/# `(4./ -$ .`*!`)/0- `)`
'$! O` - . -# -.` ++'4` ` 1./` )0( -` *!` $!! - )/` #$"#]/#-*0"#+0/`
- . -#` / #)*'*"$ .` /#/` +-*0 ` 1 -]$)- .$)"` (*0)/.` *!`
$)!*-(/$*)N`# `$)!*-(/$*)`$/. '!`$.`*!`'$//' `2*-/#O`0/`/# `&)*2' " ` /#/` )` ` 3/-/ ` !-*(` $/` )` # '+` 0.` /*` // -` 0) -./)` '$! ` )`
$. . .O` /*` - / ` )*1 '` /# -+$ .` )` 0- .O` .` 2 ''` .` /*` # '+` 0.` /*`
1 '*+` ) 2` $*/ #)*'*"4` +-*0/.` /#/` $(+-*1 ` *0-` 1 -44` '$1 .N`
# - !*- ` *) ` *!` /# ` (%*-` - . -#` #'' )" .` *!` /*4` $.` /# ` !!$$ )/`
0." ` *!` /#$.` " )*($` $)!*-(/$*)N` )` */# -` 2*-.O` #*2` /*` #-) ..` /# `
!0''`+*/ )/$'`*!`/#$.`$)!*-(/$*)`$)``*./] !!$$ )/`24`/#/`''*2.`0.`/*`
!$)`/# `#$ )`" (.`*!`$(+*-/)/`&)*2' " `!-*(`/# . `(*0)/$).`*!`
/N`
) ` *!` /# ` ($)` ./ +.` /*2-.` /# ` !!$$ )/` 0." ` *!` " )*($`
$)!*-(/$*)` $.` $)/ "-/$*)N` )/ "-/$*)` *!` " )*($` $)!*-(/$*)` ''*2.`
- . -# .`/*`*($) `)`%*$)/'4`)'45 `/`!-*(`1-$*0.`.*0- .`)`
$!! - )/` - . -#` / #)*'*"$ .O` - 0 ` /# ` ) ` /*` - +-*0 ` 3+ -$( )/.O` )` # '+` /*` - 1 '` &)*2' " ` /#/` .$(+'4` *0'` )*/` `
$.*1 - ` 4` 0.$)"` $)!*-(/$*)` !-*(` ` .$)"' ` .*0- N` *` #$ 1 ` /#$.`
"*'O` ) 2` $*$)!*-(/$.` ( /#*.O` .*!/2- ` /**'.` )` /. .` - ` - ,0$- N`
#$.`/# .$.`!*0. .`*)`/# `/*+$`*!`$)/ "-/$*)`*!`" )*($`$)!*-(/$*)`
)` $.` ./-0/0- ` $)` /# ` !*''*2$)"` 24P` /# ` . *)` #+/ -` .-$ .`
$!! - )/` ' 1 '.` *!` " )*($` $)!*-(/$*)O` /# ` /#$-` #+/ -` $.0.. .` /# ` - .*).` 2#4` " )*($` $)!*-(/$*)` $.` $)/ "-/ ` )` 2#/` /# ` - '/ `
#'' )" .` - O` /# ` !*0-/#` #+/ -` '$./.` /# ` $(.` *!` /# ` *-$"$)'`
+0'$/$*).` +- . )/ ` $)` /#$.` /# .$.O` 2#$' ` /# ` !$!/#` )` .$3/#` #+/ -.`
.-$ `/# `( /#*.`)`- .0'/.`!-*(`/#*. `+0'$/$*).N`#+/ -.`. 1 )`
)` $"#/`$.0..`)`.0((-$5 `/# `/# .$.N`
# ` *-$"$)'` +0'$/$*).` +- . )/ ` $)` /#$.` /# .$.` -)" ` !-*(` ` '**&`
$)/*` 3$./$)"` $)/ "-/$*)` /**'.` )` ( /#*.` S0'$/$*)` TO` /*` ` )*1 '`
( /#*` )` .*!/2- ` /**'` !*-` *($)$)"` /` !-*(` # / -*" ) *0.`
.*0- .` S0'$/$*)` TO` /*` 1$.0'$5$)"` $)/ "-/ ` " )*($` $)!*-(/$*)`
S0'$/$*)` T` )` /*` .-$$)"` ` 2 ]. ` /. ` +*-/'` *!`
$)/ "-/ ` $)!*-(/$*)` !*-` #0()` " )*($` 1-$/$*)` - . -#`
S0'$/$*)` TN`
! --
$.*1 -4` *!` /# ` ./-0/0- ` *!` ` )` /# ` -/$0'/$*)` *!` /# ` )/-'`
*"(` *!` (*' 0'-` $*'*"4` '0)# ` ` ) 2` -` *!` $*'*"$'` - . -#`
/#/`0'($)/ `$)`/# `*(+' /$*)`*!`/# `0()` )*( `-*% /`ST`
SCODTN` # ` +*./]" )*($` -` /#/` !*''*2 ` #.` .*` !-` 4$ ' ` )*-(*0.`
(*0)/` *!` ) 2` $)!*-(/$*)` *) -)$)"` # '/#O` $. . .O` $)$1$0'`
1-$/$*)` )` $!! - ) .` /2 )` )$('` )` +')/` .+ $ .O` .` 2 ''` .`
*0/`)0( -*0.`*/# -`.$`*) +/.`*!`'$! N``
# . ` $.*1 -$ .` $)` *($)/$*)` 2$/#` / #)*'*"$'` 1) .` #1 ``
*+ ) ` 3$/$)"`) 2`+*..$$'$/$ .`!*-`$*'*"$'`)`( $'`- . -#`)`
Figure 1. Different levels of biological data and their interactions.
1 '*+( )/O` 0/` '.*` #1 ` - / ` ) 2` #'' )" .` !*-` 3/-/$)"`
&)*2' " ` !-*(` /# ` *)./)/'4` "-*2$)"` (*0)/` *!` $)!*-(/$*)N` *1 '`
( /#*.` )` /**'.` - ` ) ` /*` )'45 O` *($) ` )` $)/ -+- /` /#$.`
$)!*-(/$*)N`*`*(+'$.#`/#$.O`0) -./)$)"`*!`/# `$!! - )/`' 1 '.`*!`
0) -'4$)"` $*'*"$'` +# )*( )` )` - '/ ` " )*($` - . -#`
/ #)*'*"$ .` $.` ) N` $"0- ` C` $''0./-/ .` $!! - )/` ' 1 '.` *!` " )*($`
$)!*-(/$*)N`# `.0. ,0 )/`. /$*).`2$''` .-$ `/# . `$!! - )/`/4+ .`
*!` /` 0. ` $)` " )*($` - . -#` $)` "- / -` /$'N` ' ` C` +-*1$ .` )`
*1 -1$ 2` *!` /# ` (*0)/` *!` $!! - )/` /4+ .` *!` $)!*-(/$*)` $)` ` #0()`
" )*( N`
`
Table 1. Overview of information in a human genome from Ensembl database (Ensembl version 66, Homo Sapiens assembly GRCh37.p6).
Type of information Amount
Base pairs 3,286,906,305
Known protein-coding genes 20,563
Novel protein-coding genes 536
Pseudogenes 15,520
RNA genes 11,960
Gene exons 673,807
Gene transcripts 190,053
Short Variants (SNPs, indels, somatic mutations) 52,030,260
2.1 PHENOMICS
# )*/4+ .` - ` *. -1' ` #-/ -$./$.` *-` /-$/.O` )` /# - !*- ` - +- . )/` ` '..$'` /4+ ` *!` ( .0- ' ` 3+ -$( )/'` $)!*-(/$*)N`
# )*/4+ .` )` ` 1$-/0''4` )4` /4+ ` *!` *. -1' ` #-/ -$./$O`
$)'0$)"` 1 '*+( )/'O` #1$*-'O` $*# ($'` *-` +#4.$*'*"$'`
+-*+ -/$ .N`'$)$'` 3(+' .`*!`+# )*/4+ .`$)'0 `#-/ -$./$.`.0#`
.`# $"#/O` 4 `*'*-`*-`.*$'` #1$*-N`$'# '(`*#)). )`$)/-*0 `/# ` / -(.` +# )*/4+ ` )` " )*/4+ ` $)` CKCCO` (&$)"` /# ` $./$)/$*)` /#/`
+# )*/4+ .` - ` *. -1' ` /-$/.O` 2#$' ` " )*/4+ .` - ` )` *-")$.(X.`
$)# -$/ ` $)!*-(/$*)O` 1 )` $!` /# 4` - ` )*/` 3+- .. ` *-` $- /'4`
*. -1' ` SETN` * -)` - . -#` / #)*'*"$ .` #1 ` )' ` $- /`
( .0- ( )/` *!` " ) /$` $)!*-(/$*)` )` /# - !*- ` #1 ` ( ` /#$.`
$./$)/$*)`.*( 2#/`($"0*0.N` )`/#$.`/# .$.O`+# )*/4+ `2$''`- ! -`/*`
'..$'` ( .0-' ` /-$/.O` 2#$' ` / -(.` .0#` .` /-).-$+/*( O`
( /*'*( ` )` +-*/ *( ` )` ` *).$ - ` .` .0'.. .` *!`
+# )*/4+ .N`# `/ -(`" )*/4+ `2$''` )*/ `# -$/' `$)!*-(/$*)`.0#`.`
N`
# )*/4+ .` - ` *).$ - ` /*` ` - .0'/.` *!` $)/ -/$*).` /2 )`
" )*/4+ .` )` )1$-*)( )/N` *-` 3(+' ` 2# )` /2*` /''` + *+' ` #1 ` `
#$'O` /# ` #$'` $.` '$& '4` /*` #1 ` $)# -$/ ` " )*/4+$` ,0'$/$ .` /#/` 2$''`
- .0'/` $)` #$(\# -` $)"` /''O` .` '*)"` .` /# ` )1$-*)( )/` +-*1$ .`
.0!!$$ )/` )0/-$/$*)N` )` " )*($` - . -#O` +# )*/4+ .` - ` *!/ )`
*).$ - `/*` `/# `*0/*( .`*!`$)/ - ./O` N"N`2# )`./04$)"`/# `" ) /$`
*(+*) )/.` /#/` (& ` ` + -.*)` /''O` - .0'/` $)` #$"#` #*' ./ -*'` ' 1 '.O`
0. ``$. . O`*-`'/ -` #1$*-N`)*/# -`*((*)`0. `!*-`+# )*/4+ .`$.`
/*` $(+-*1 ` )'4/$'` (* '.` 4` $)'0$)"` +# )*/4+$` 1-$' .N` *-`
3(+' `2# )`./04$)"` /$)"`#$/.`S`+# )*/4+ TO`*) `($"#/`2)/`/*`
/& ` $)/*` *0)/` /# ` " ) -` S)*/# -` +# )*/4+ T` )` 2 $"#/` S4 /`
)*/# -` +# )*/4+ T` *!` /# ` .0% /N` #$.` ''*2.` /# ` (* '` /*` *)/-*'` !*-`
$!! - ) .`$)` /$)"`#$/.`0. `4`" ) -`*-`*4`2 $"#/N`
.` +# )*/4+ .` )` 1-4` !-*(` $*# ($'` +-*+ -/$ .` /*` #1$*-'`
#$/.O` /# ` (*0)/` *!` ( /#*.` !*-` ( .0-$)"` +# )*/4+ .` $.` 1./O` !-*(`
.$(+' ` 1$.0'` $).+ /$*)` )` ,0 ./$*))$- .` /*` #$]/ #` - . -#`
,0$+( )/N` # )*($.` #.` )` !$) ` .` /# ` ,0$.$/$*)` *!` #$"#]
$( ).$*)'`+# )*/4+$` /` *)` )` *-")$.(]2$ ` .' ` SFTO` .. )/$''4`
( )$)"` ./04$)"` (0'/$+' ` +# )*/4+ .` *)` /# ` ' 1 '` *!` ` .$)"' `
$)$1$0'N`
2.2 GENOMICS AND GENETICS
)*($.O`.`/# `./04`*!`/# `" )*( .`*!`*-")$.(.O`#.`./-*)"`-**/.`$)`
.(''`.' `. ,0 )$)"`./0$ .`/#/`#1 `.0. ,0 )/'4` 3+) `/*`!0'']
.$5 ` " )*( ` +-*% /.` *!` $!! - )/` *-")$.(.N` # ` 0) -/&$)"` *!`
. ,0 )$)"` )` ))*//$)"` ` !0''` " )*( ` 2.` +- 1$*0.'4` . )` .` #0" ` +-*% /O`- ,0$-$)"`'-" `*).*-/$`)`1./`- .*0- .N` 0. `*!`/#$.O`/# `
!*0.` #.` +- 1$*0.'4` )` +' ` *)` . ,0 )$)"` - ! - ) ` " )*( .` *!`
$)$1$0'.O` )` /# )` 0.$)"` !$) ].' ` ( /#*.` /*` ./04` " )*($.` $)`
'-" `+*+0'/$*).N`# . `( /#*.`$)'0 `. ,0 )$)"`*!`.('' -`" )*($`
- "$*).O` !*-` 3(+' ` - "$*).` 2$/#` )$/ ` " ) .O` )` ./04$)"` *!`
$)$1$0'` 1-$/$*)` $)` /# ` !*-(` *!` .$)"' ])0' */$ ]+*'4(*-+#$.(`
ST`" )*/4+$)"`./0$ .N``
*((*)` /4+ .` *!` 0-- )/` ` - . -#` ( /#*.` $)'0 ` " )*( ] 2$ ` ..*$/$*)` ./0$ .` ST` 2# - ` ($-*--4` / #)*'*"$ .` - ` 0. ` /*` ./04` 0+` /*` ($''$*).` *!` .` $ )/$!$ ` $)` +-*% /.` .0#` .` /# ` )/ -)/$*)'` ++` -*% /` SG^IT` $)` '-" ` +*+0'/$*).N` ` - ` 0.0''4` !*''*2 ` 4` ` - +'$/$*)` ./" ` 2# - ` /# ` (*./` +-*($.$)"`
!$)$)".`- `- +'$/ `$)`)`$) + ) )/`.(+' `SJOKTN`
0-- )/`/ #)*'*"$'`1) ( )/.`#1 `- .0'/ `$)`- /$*)`*!`)*1 '`
#$"#]/#-*0"#+0/` . ,0 )$)"` S.*` '' ` ) 3/]" ) -/$*)` . ,0 )$)"` *-`
+` . ,0 )$)"T` / #)*'*"$ .N` # . ` / #)*'*"$ .` #1 ` /# ` +-*($. ` *!`
(&$)"`. ,0 )$)"`'-" `" )*($`- "$*).O`0+`/*`!0''`" )*( .`!!*-' `
*)``+*+0'/$*)`./04`.' N`#0.`" )*($`- . -#`$.`/0-)$)"`&`/*`$/.`
-**/.`2# )`(*- `)`(*- `!*0.`$.`.#$!/$)"`&`/*`. ,0 )$)"`./0$ .N``
+-$( ` 3(+' `*!``+*+0'/$*)`.' `2#*' ]" )*( `. ,0 )$)"`+-*% /.`
$.` /# ` CBBB` )*( .` +-*% /O` 2# - ` /# ` +$'*/` +#. ` $)'0 ` 2#*' ]
" )*( ` . ,0 )$)"` *!` CIK` $)$1$0'.` !-*(` !*0-` +*+0'/$*).O` #$"#]
*1 -" ` . ,0 )$)"` *!` /2*` (*/# -^!/# -^#$'` /-$*.O` )` 3*)]
. ,0 )$)"`*!`HKI`$)$1$0'.`!-*(`. 1 )`+*+0'/$*).`SCBTN`
2.3 TRANSCRIPTOMICS
# ` 1$'$'$/4` *!` *(+' / ` " )*( .` #.` '.*` 1) ` /# ` ./04` )`
0) -./)$)"` *!` /# ` ) 3/` ' 1 '` *!` " )*($` $)!*-(/$*)O` /# ` /-).-$+/*( N` 1$)"` /# ` *(+' / ` " )*( ` *!` )` *-")$.(` ''*2.`
- . -# -.` /*` "$)` ` // -` 0) -./)$)"` *!` #*2` " ) .` 2*-&` )` /# `
&$)` *!` +-*0/.` - / ` !-*(` /# ` " )*($` . ,0 ) ` /#-*0"#`
/-).-$+/$*)N`) `*!`/# `(%*-`1) ( )/.`. `*)`/#$.`$)!*-(/$*)`
#.` )`/# ` 1 '*+( )/`*!`#$"#]/#-*0"#+0/`" ) ` 3+- ..$*)`)'4.$.`
/ #)*'*"$ .O` ($)'4` " ) ` 3+- ..$*)` ($-*--4.O` 2#$#` !$'$// .`
( .0- ( )/`*!`/# `(*0)/`*!`.+ $!$``+-*0/.`$)``.(+' `*)``
" )*( ]2$ ` .' N` ) ` 3+- ..$*)` ($-*--4.` #1 ` +'4 ` ` (%*-`
-*' ` $)` /# ` ./04` *!` !0)/$*)'` " )*($.O` )` - ` 0-- )/'4` ./)-`
- . -#`( /#*.`$)`/# `!$ '`*!`$*/ #)*'*"4`)`$*( $$) N``
/04$)"`/# `/-).-$+/*( `#.`'.*`.# `) 2`'$"#/`*)`)`$)/ - ./$)"`
'..`*!`.O`/# `.*]'' `)*)]*$)"`.`/#/`+'4``-*' `$)`()4`
''0'-`+-* .. .O`0/`- `)*/`) ..-$'4`/-).'/ `$)/*`+-*/ $).N`# . `
$)'0 ` (*' 0' .` .0#` .` ($-*.` S($.T` )` .(''` $)/ -! -$)"`
.`S.$.T`/#/`/& `+-/`$)``$)/ -! - ) `S$TO``+-* ..`/#/`
!! /.` - "0'/$*)` *!` " ) ` 3+- ..$*)O` )` +-*1$ .` /# ` .$.` !*-`
/$1/$*)` )` /$1/$*)` *!` " ) .O` )` )` /# !*- ` ` 0. ` !*-`
+0-+*. .`.0#`.`.$`- . -#`*-``. `/# -+$ .`SCCTN`
# ` 1 '*+( )/.`/&$)"`+' `$)`/# `!$ '`*!`" )*($``- . -#`
- ` '.*` #++ )$)"` 2$/#` O` .` - . -#` $.` (*1$)"` /*2-.` #$"#]
/#-*0"#+0/`. ,0 )$)"`*!``S]. ,T`SCDTN`- 1$*0.`&)*2' " `*!`
/# `. ,0 ) `$.`)*/`- ,0$- `SCETO`)`/#$.`+-*1$ .`)`$(+-*1 ( )/`*1 -`
()4` +- 1$*0.` " )*( ]2$ ` /-).-$+/*($` - . -#` / #)*'*"$ .` .0#`
.`" ) ` 3+- ..$*)`($-*--4.N
2.4 PROTEOMICS
$($'-`/*`/-).-$+/*($.O`/# `$'$/4`/*`./04`/# `" )*( `. ,0 ) `*!`)`
*-")$.(` ''*2.` /# ` +- $/$*)` *!` ` . ,0 ) .` /#/` - ` !$-./`
/-).-$ ` $)/*` O` )` '/ -` /-).'/ ` $)/*` +-*/ $).N` ` '-" `
$!! - ) ` /2 )` /# ` ./04$)"` *!` )0' $` $.` )` +-*/ $).` $.` /#/` $/`
#.`'*)"` )`0) -./**`)*/$*)`/#/`/# `/#- `$( ).$*)'`./-0/0- `*!``
+-*/ $)` +'4.` ` (%*-` -*' ` $)` $/.` !0)/$*)O` )` &)*2$)"` /# ` ($)*` $`
. ,0 ) ` $.` %0./` ` .(''` +-/` *!` 0) -./)$)"` #*2` /# . ` *(+' 3`
./-0/0- .` !*-(N` #$.` #.` '.*` #$) - ` / #)*'*"4` 1 '*+ -.` 2$/#`
$/$*)'`#'' )" .O`.`/# `!*0.`*!`+-*/ *($.`- . -#`#.`)*/` )`$)`
/# ` . ,0 )$)"` *!` ($)*` $.O` 0/` -/# -` *)` /-4$)"` /*` .*'1 ` /# ` /#- ]
$( ).$*)'` ./-0/0- ` *!` +-*/ $).O` )` /#0.` #*2` /# . ` ./-0/0- .` - `
!*-( ` !*-` 3(+' ` 4` +*./]/-).'/$*)'` (*$!$/$*).O` )` #*2`
$!! - )/` +-*/ $).` *-` .+ $!$` - "$*).` *!` +-*/ $).` $)/ -/` 2$/#` */# -`
(*' 0' .`SCFTN`
.$ .`( /#*.`!*-`./04$)"`./-0/0-'`.+ /.`*!`+-*/ $).O`( /#*.`
#1 ` )` 1 '*+ ` !*-` ./04$)"` */# -` - .` *!` +-*/ *($.` .0#` .`
3+- ..$*)`)`'*'$5/$*)`*!`+-*/ $).`SCGTN`# . `$)'0 `+-*/ $)`(..`
.+ /-*( /-4` SCHT` )` +-*/ $)` 3+- ..$*)` ($-*--4.` /#/` 2*-&` $)` `
!.#$*)` .$($'-` /*` ` )` " ) ` 3+- ..$*)` ($-*--4.O` 3 +/` /#/`
$)./ ` *!` *(+' ( )/-4` )0' */$ ` . ,0 ) .O` )/$*$ .` - ` 0. ` /*`
/ /`/# ` 3$./ ) `*!`+- !$) `+-*/ $).N`
2.5 METABOLOMICS
/*'*($.`$.``!$ '`'*. '4`- '/ `/*`+-*/ *($.O`)`.#- .`*((*)`
- . -#`/ #)*'*"$ .`)`( /#*.O`.0#`.`'$,0$`#-*(/*"-+#4](..`
.+ /-*( /-4`S]T`SCIT` )`)0' -`(") /$` - .*)) ` ST`SCJT`
/#/` - ` 0. ` /*` . +-/ O` $ )/$!4` )` ,0)/$!4` *(+*0).N` )./ ` *!`
+-*/ $).O` ( /*'*($.` !*0. .` *)` /# ` ./04` *!` .(''](*' 0' ` ( /*'$/ .O` .0#` .` ( /*'$` $)/ -( $/ .O` #*-(*) .O` )` */# -`
.$")'$)"` (*' 0' .` )` . *)-4` ( /*'$/ .N` ) ` *!` /# ` (%*-` !*0.`
- .` *!` ( /*'*($.` $.` '$+$*($.O` 2#$#` $(.` /*` *(+- # ).$1 ` )'45 `/# `'$+$.`+- . )/`$)``$*'*"$'`.4./ (`SCKTN`0-- )/`'$+$*($.`
)'4.$.` +'/!*-(.` )' ` ,0)/$!$/$*)` *!` #0)- .` *!` $!! - )/` '$+$`
(*' 0' .`!-*(`$!! - )/`'$+$`'.. .`SDBODCTN``
.$ .` "$1$)"` ` + -` 0) -./)$)"` *)` #*2` ( /*'$.(` )`
$*'*"$'`.4./ (.`*+ -/ O`( /*'*($.` .``!$ '` *!`./04`+-*1$ .``
( ).`!*-`- /$)"`$")*./$`/**'.O`.`2 ''`.` 1 '*+$)"`) 2`/# -+$ .N`
1) .`#1 ` )`( `!*-` 3(+' `$)`/# `!$ '.`*!`-0"`( /*'$.(O`
/*3$$/4O` .` 2 ''` .` $)` )0/-$" )*($.` SDDODETO` 2# - ` /# ` - '/$*).#$+`
/2 )`)0/-$/$*)`)`" ) .`$.`$)1 ./$"/ N`
2.6 EPIGENETICS
/$)$)"` /# ` . ,0 ) ` *!` /# ` #0()` " )*( ` '.*` -$. .` /# ` ,0 ./$*).`
*) -)$)"` ( #)$.(.` *!` $)# -$/) ` /#/` - ` )*/` . ` +0- '4` *)` /# `
`. ,0 ) `*!`)`*-")$.(N`+$" ) /$.`/-$ .`/*`/&' `/#$.`,0 ./$*)`4`
+-*1$$)"`) 2`$)!*-(/$*)`*)`#)" .`/#/`- ($)`/#-*0"#` ''`$1$.$*)`
)`.*( /$( .`-*..`" ) -/$*).O`0/`- `)*/`. `*)``. ,0 ) ` SDFODGTN` #)$.(.`*!` +$" ) /$`$)# -$/) `$)'0 ``)`#$./*) ` ( /#4'/$*)` SDHTO` #-*(/$)` - (* '$)"` SDITO` .` 2 ''` .` $)# -$/) ` *!`
- "0'/*-4`(*' 0' .`.0#`.`+-*/ $).`*-``$)1*'1 `2$/#`$`SDJTN`
/04$)"` +$" ) /$.` #.` .#$!/ ` /# ` !*0.` *!` +0- '4` ./04$)"` /# ` . ,0 ) ` *!` )0' $` $.` /*` '.*` *).$ -$)"` /# ` /#- ]$( ).$*)'`
./-0/0- ` SDK^ECTO` .$($'-` /*` 2#/` #.` )` !*-` ` '*)"` /$( ` )/-'` /*`
+-*/ *($.`./0$ .`!*-``'*)"`/$( N`
)/-'` / #)*'*"$ .` 0. ` $)` ./04$)"` +$" ) /$.` $)'0 ` #-*(/$)`
$((0)*+- $+$//$*)` S# TO` 2#$#` $.` 0. ` /*` ./04` +-*/ $)` `
$)/ -/$*).N` ` '-" ].' ` ($-*--4` 1-$)/` $.` # ]*)]#$+N`
*) /# ' ..O` /# ` !$ '` $.` (*1$)"` /*2-.` #$"#]/#-*0"#+0/` . ,0 )$)"`
/ #)*'*"$ .`.0#`.`# ]. ,O`$.0'!/ `. ,0 )$)"`/#/`$.`0. `/*`./04`
` ( /#4'/$*)` )` ]. ,` S*-(' #4 ]..$./ ` .*'/$*)` *!`
"0'/*-4`' ( )/.T`0. `/*`$ )/$!4`*+ )`#-*(/$)`.$/ .`SEDTN`
2.7 INTERACTOMICS
)/ -/*($.` .-$ .` /# ` ./04` *!` (*' 0'-` $)/ -/$*).` $)` ''.N`
-$/$*)''4` /# . ` ./0$ .` #1 ` )` !*0. ` *)` ` +-/$0'-` '..` *!`
$)/ -/$)"` (*' 0' .O` .0#` .` +-*/ $)]+-*/ $)` $)/ -/$*).O` 0/` .` $/` $.`
*($)"`(*- `)`(*- `' -O`/# - `- `$(+*-/)/`$)/ -/$*).` /2 )`
$!! - )/` ' 1 '.` *!` " )*($` (*' 0' .O` -)"$)"` !-*(` O` ` /*`
+-*/ $).` )` ( /*'$/ .N` $"#]/#-*0"#+0/` ./0$ .` /#/` *($) ` /`
!-*(` $!! - )/` ' 1 '.` *!` " )*($` $)!*-(/$*)` - ` *($)"` (*- ` )`
(*- ` *((*)+' N` 3(+' .` *!` /# . ` ./0$ .` $)'0 ` 3+- ..$*)`
,0)/$//$1 ` /-$/` '*$` S T` )'4.$.` 2# - ` ` 3+- ..$*)` $.`
..*$/ ` 2$/#` ` 1-$/$*).` SEEOEFTO` ./0$ .` *-- '/$)"` ` )`
+-*/ $)` 3+- ..$*)`SEGOEHT`*-`./0$ .`/#/`*($) `/`!-*(`O``
)`( /*'$/ `( .0- ( )/.`SEITN``
4./ (.` $*'*"4` #.` )` *) ` *!` /# ` ($)` !$ '.` /*` ++'4`
$)/ -/*($.O` $)` *- -` /*` */$)` ` *(+- # ).$1 ` 0) -./)$)"` *!` ` .4./ (O` .0#` .` ` ''` *-` )` *-")$.(N` . ` *)` /# ` $)/ -/*($.`
$)!*-(/$*)O` .4./ (.` $*'*"4` $(.` /*` 0$'` (* '.` *!` /# ` $!! - )/`
.$")'$)"`)`( /*'$`+/#24.`SEJTN`
`
" ---
)`*- -`/*`"$)``(*- `*(+' / `0) -./)$)"`*!``$*'*"$'`.4./ (O`
$)/ "-/$*)` *!` $!! - )/` ' 1 '.` *!` " )*($` $)!*-(/$*)` $.` - ,0$- N`
*- *1 -O` $)/ "-/$)"` " )*($` $)!*-(/$*)` )` ` *./] !! /$1 ` )`
/#$'N` #$.` #+/ -` $.0.. .` /# ` -/$*)' O` .` 2 ''` .` /# ` - '/ `
$*'*"$'`)`/ #)$'`#'' )" .`!*-`$)/ "-/$)"`" )*($`$)!*-(/$*)N`
3.1 RATIONALE FOR INFORMATION INTEGRATION
# ` ($)` .$ )/$!$` -/$*)' ` !*-` $)/ "-/$)"` " )*($` $)!*-(/$*)` $.`
.$(+' O` /# ` ) ` /*` - '/ ` &)*2' " ` /2 )` $!! - )/` /4+ .` *!`
3+ -$( )/.N` $1$)"` .4./ (.` *).$./` *!` )0( -*0.` ' 1 '.` *!` $)/ -/$)"`
*(+*) )/.O`)`/*`0) -./)`/# `.4./ (`)`- '/ `+# )*( )O`*) ` (0./`. `2#/`$.`#++ )$)"`*)`)` /2 )`''`/# . `$!! - )/`' 1 '.N`# ` ' 1 '.`*).$./`*!`O`O`+-*/ $).O`( /*'$/ .`)`*/# -`$)/ -/$)"`
(*' 0' .O`)` 0. `(*./`#$"#]/#-*0"#+0/`- . -#`/ #)*'*"$ .`*)'4`
!*0.` *)` ` .$)"' ` ' 1 '` S N"N` ` . ,0 )$)"` *-` " ) ` 3+- ..$*)`
($-*--4.T` *-` $)/ -/$*).` *!` /2*` ' 1 '.` S N"N` # ]. ,` ( .0-$)"`
+-*/ $)]` $)$)"TO` - . -# -.` ) ` /*` + -!*-(` (0'/$+' ` 3+ -$( )/.`/*` `' `/*`*/$)`$)!*-(/$*)`!-*(`/# `1-$*0.`' 1 '.`)`
/# $-`$)/ -/$*).N`*($)$)"`/`!-*(`/# . `$!! - )/` 3+ -$( )/.`$.``
./-/$)"` +*$)/` !*-` " //$)"` ` + -` 0) -./)$)"` *!` /# ` 0) -'4$)"`
+# )*( )`*!`$)/ - ./N`
!/ )`/# `- .*).`!*-`$)!*-(/$*)`$)/ "-/$*)`- `)*/`$- /'4`. `*)`
/# `.$ )/$!$`,0 ./$*).O`0/`-/# -`*)`/# `+-/$'`$..0 .`*!`*)0/$)"``
./04N`3(+' .`$)'0 `+ -!*-($)"``" ) ` 3+- ..$*)` 3+ -$( )/`0.$)"`
`.+ $!$`($-*--4`(* 'O`)`'/ -` .$-$)"`/*`*``(*- `.(+' .`
/*`/# ` 3+ -$( )/`)`)*/$$)"`/#/`/# `($-*--4`#.` )`- +' `4`
` ) 2 -` 1 -.$*)N` )` ` .$/0/$*)` .0#` .` /#$.O` $/` $.` - .*)' ` /*` ./$(/ `
#*2` *(+-' ` /# ` - .0'/.` /2 )` /# ` $!! - )/` 1 -.$*).` *!` /# ` ($-*--4`2*0'` O`)`#*2`/# 4`*0'` `$)/ "-/ N`# `.( `$.`/-0 ` 2# )` .$-$)"` /*` *($) ` /` !-*(` 3+ -$( )/.` + -!*-( ` 0.$)"`
.$($'-`+-*0/.`!-*(`$!! - )/`()0!/0- -.`)`$!! - )/`/ #)*'*"$ .`
/#/` ( .0- ` /# ` .( ` $*'*"$'` +# )*( )` S N"N` " ) ` 3+- ..$*)`
($-*--4.`)`]. ,TN`
) ` *!` /# ` ($)` - .*).` !*-` 2)/$)"` /*` $)/ "-/ ` /` +-*0 ` *)`
$!! - )/` / #)*'*"4` +'/!*-(.` $.` /*` - ]0. ` /` *-$"$)''4` - / ` !*-`
*/# -` +0-+*. .O` *!/ )` 4` */# -` - . -# -.N` *'' /$)"` .(+' .` )`
+ -!*-($)"` #$"#]/#-*0"#+0/` " )*($` 3+ -$( )/.` $.` 3+ ).$1 O` )`
/# - !*- ` - ]0.$)"` 3$./$)"` /` $.` *!/ )` 1 -4` *./] !!$$ )/N` .` )`
3(+' O` /# ` ) +$ ).` +-*% /` *($) .` /` !-*(` KOIJE` +0'$'4`
1$'' `" ) ` 3+- ..$*)`.(+' .O`- +- . )/$)"`CIG`/4+ .`*!`# '/#4`)`
+/#*'*"$'` /$..0 .` SEKTN` *-` ` - . -#` "-*0+` /*` *'' /` )` )'45 ` `
*-- .+*)$)"` )0( -` *!` #0()` /$..0 ` .(+' .` 2*0'` ( )` 4 -.` *!`
2*-&`)`)`$)1 ./( )/`*!`($''$*).`*!` 0-*.N`
]0.$)"`)`$)/ "-/$)"` 3$./$)"`/`$.`*!/ )`'.*`)` /#$'`#*$ O`.`
$/` ''*2.` ./0$ .` /*` ` *)0/ ` 2$/#*0/` /# ` ) ` /*` + -!*-(` ) 2`
3+ -$( )/.O` - 0$)"` /# ` ) ` !*-` *'' /$)"` ) 2` #0()` .(+' .O`
+ -!*-($)"`)$('` 3+ -$( )/.`*-`.+ )$)"`- . -#`!0)$)"N`0-- )/'4`
(%*-` .$ )/$!$` %*0-)'.` )*0-" ` - . -# -.` /*` .#- ` /# $-`
3+ -$( )/'` /O` )` )!*- ` /#$.` 4` - ,0$-$)"` - . -# -.` /*` .0($/`
/# $-`/`/*`+0'$`/`- +*.$/*-$ .`.0#`.` ) `3+- ..$*)`()$0.`
ST` SFBT` )` --43+- ..` SFCT` 0+*)` +0'$/$*)` *!` /# ` ./04N`
)!*-(/$*)` $)/ "-/$*)` ( /#*.` '.*` )' ` - . -# -.` /*` + -!*-(`
./0$ .` 0.$)"` (* '` *-")$.(` *-` ''` '$) .` )` +-*% /` /# ` - .0'/.` /*`
#0().` S$N N` -*..].+ $ .` ./0$ .TO` (&$)"` $/` +*..$' ` /*` ./04`
+# )*( )`/#/`*0'`)*/` ` /#$''4`./0$ `$)`#0().N`
3.2 CHALLENGES OF INFORMATION INTEGRATION )!*-(/$*)`$)/ "-/$*)`#*'.`()4` ) !$/.O`0/`#.` )`#(+ - `4`
. 1 -'` #'' )" .N` # . ` #'' )" .` )` ` -*0"#'4` $1$ ` $)/*`
$*'*"$'`#'' )" .`/#/`-$. `!-*(`/# `*(+' 3$/4`*!`'$1$)"`.4./ (.`)`
*0-`'$($/ `0) -./)$)"`*!`/# (O`)`/ #)$'`#'' )" .O`2#$#`- ` 0. `4`*0-`/ #)*'*"$'`#*$ .`)`'$($//$*).N`
*((*)` $*'*"$'` #'' )" .` - 1*'1 ` -*0)` $!! - ) .` $)` ./04`
.$")O` 3+ -$( )/'` *)$/$*).` )` 1-$/$*)` /2 )` .+ $ .N` *-`
3(+' ` #*2` *(+-' ` - ` /2*` 3+ -$( )/.` + -!*-( ` *)` .'$"#/'4`
$!! - )/` /$( ` +*$)/.O` *-` #*2` 2 ''` * .` ` " ) ` 3+- ..$*)` 3+ -$( )/`
+ -!*-( `2$/#`($ `*(+- `2$/#`.$($'-` 3+ -$( )/`+ -!*-( `2$/#`
-/.N`$*'*"$'`#'' )" .`'.*`$)'0 `!0)( )/'`+-*' (.`2$/#`#*2`
2 ` !$) `" )*($`*(+*) )/.`.0#`.`" ) .`)`/# $-`- '/$*).#$+.`/*`
*/# -`*(+*) )/.N``*((*)` 3(+' `!-*(``./0$ .`$.```/#/`
#.` )`!*0)`/*` `..*$/ `2$/#``$. . O`-$.$)"``,0 ./$*)`*0/`
/# ` - '/ ` +/#*+#4.$*'*"$'` +-* ..N` *-` /#$.` +0-+*. ` - . -# -.`
0.0''4`'**&`$)/*`) -4`" ) .O`)`*!/ )`!$)`/#/`/# ``$.`)*/`'*/ `
$).$ `)4`"$1 )`" ) O`0/`($"#/`/0''4` `'*/ ` /2 )`/2*`" ) .N`
)` ` .$/0/$*)` .0#` .` /#$.O` $!` - . -# -.` 2*0'` '$& ` /*` $)/ "-/ ` !*-`
3(+' ` " ) ` 3+- ..$*)` /` 2$/#` /# ` ` /O` /# - ` $.` )*` ' -`
*). ).0.`*)`2#$#`" ) S.T`/# ``.#*0'` `'$)& `/*N``
`
Table 2. A fraction of identifiers linked to a single human gene (ST7) in the Ensembl database (version 62). Count is the number of identifiers of type named in the Identifier type column.
Identifier type Count Examples
HGNC symbol 1 ST7
Description 1 suppression of tumorigenicity 7 Ensembl Gene ID 1 ENSG00000004866
Illumina HumanWG 6 v3 3 ILMN_1702175, ILMN_1707763, ILMN_1746137
UniProt Gene Name 3 ST7, Q9NRC0, Q9NRC1 RefSeq DNA ID 3 NM_021908, NM_018412,
NR_002332
UniProt/TrEMBL Accession 12 Q9NRC0, Q75MZ7, C9JZV9, C9JX79 EMBL (Genbank) ID 18 AC002542, AC106873, AC003987,
AF234886
Ensembl Protein ID 21 ENSP00000377092, ENSP00000265437
IPI ID 21
IPI00878915, IPI00878525, IPI00852755, IPI00030166, IPI00922544
Ensembl Transcript ID 29
ENST00000393446, ENST00000265437, ENST00000393451
HGNC transcript name 29 ST7-013, ST7-002, ST7-007, ST7- 015, ST7-001
Affy HuEx 1_0 st v2 51 3020553, 3020498, 3020546, 3020497, 3020552
Ensembl Exon ID 82
ENSE00001515400, ENSE00001752339, ENSE00001623906
dbSNP Reference ID 2135 rs72023459, rs71794256, rs58892731, rs71921709
`
#)*'*"$'` #'' )" .` - ` ($)'4` 0. ` 4` $!! - ) .` /2 )`
1-$*0.` " )*($` - . -#` / #)*'*"$ .` /#/` ( .0- ` /# ` .( ` 3+ -$( )/'`1-$' `$)`$!! - )/`24.O`.`2 ''`.`4`.*!/2- `/**'.`)`
/. .` /#/` $ )/$!4O` ./-0/0- ` )` ()" ` /# ` 3+ -$( )/'` /` $)`
1-$*0.` 24.N` *-` 3(+' ` $/` $.` *((*)` !*-` ` " ) ` /*` #1 ` . 1 -'`
*5 ).`*!`$ )/$!$ -.`..$") `/*`$/`4`1-$*0.`*).*-/$O`*(+)$ .`)`
- . -#`"-*0+.O`)`/# `- '/$*).#$+.` /2 )`/# . `$ )/$!$ -.`- `)*/`
*!/ )`1 -4`' -N`' `D`$''0./-/ .`+-/`*!`/# . `1-$*0.`$ )/$!$ -.`'$)& ` /*``.$)"' `" ) N``
# ` !*''*2$)"` +-"-+#.` .-$ ` . ' / ` #'' )" .` $)` ` "- / -`
/$'N`
"$)#(@ $@ (N` # ` (*0)/` *!` /` +-*0 ` 4` ) 3/]" ) -/$*)`
. ,0 )$)"` #.` )` "-*2$)"` 3+*) )/$''4N` ` .$)"' ` . ,0 )$)"`
(#$) ` )` )*2` +-*0 ` *1 -` FB` ` *!` . ,0 ) ` - .` + -` 4O`
*-- .+*)$)"` /*` *1 -` G` ` *!` $"$/'` $(" ` /N` # ` CBBB` )*( .`
+-*% /` +$'*/` /O` - +- . )/$)"` +-* .. ` . ,0 ) .` !-*(` HDK` + *+' ` $.`
-*0"#'4` INE` ` *!` . ,0 ) ` /N` *2)'*$)"` /#$.` /` !-*(` ` 2 '']
*)) / ` .$/ ` $.` ./$(/ ` /*` /& ` !-*(` C]E` 2 &.N` # ` (*0)/` *!`
. ,0 )$)"`/O`$)`$/$*)`/*`$)- .$)"`/# `(*0)/`*!`*/# -`/4+ .`*!`
/` 1$'' ` !-*(` " )*($` /. .` $.` ` (%*-` #'' )" ` !-*(` /# ` +*$)/`*!`1$ 2`*!`/`./*-" O`/-).! -`)`*(+0//$*)'`/$( N`SFDT`
"@'%@ '')':`$!! - )/`" )*($`/. .O`- . -#`"-*0+.`)`
/ #)*'*"4` +-*1$ -.` 0. ` $!! - )/` )($)"` ( /#*.` !*-` .-$$)"`
" )*($` ! /0- .` .0#` .` " ) .N` #$.` - .0'/.` $)` 1-$*0.` )( ` .+ `
*)!'$/.O` 2# - ` $!! - )/` $ )/$!$ -.` - ` '$)& ` /*` /# ` .( ` ! /0- O`
*-- .+*)$)"` ! /0- .` - ` )*/` '$)& ` /2 )` )( ` .+ .O` *-` /# ` !$)$/$*)`*!`/# `! /0- `$!! -.` /2 )`)( `.+ .N`/0$ .`#1 `!*0)`
` #$"#` ' 1 '` *!` $.- +)4` (*)"` /# ` (++$)"` - .*0- .O` 2# - ` ,0 -4$)"``(++$)"`- .*0- `2$/#` N"N``($-*--4`+-* `. /`$ )/$!$ -`
)`- .0'/`$)``2$ '4`$!! - )/`'$./`*!`- '/ `+-*/ $).`*-` ) `)/*'*"4`
/ -(.`SFEOFFTN`#'' )" .`'.*`$)'0 `#)" .`$)`/# `$ )/$!$ -.` /2 )`
$!! - )/` /` 1 -.$*).N` -$*0.` .*'0/$*).` .0#` .` /# ` $! ` $ ) ` )/$!$ -`S T`#1 ` )`- / `/*`.*'1 `/# . `$..0 .O`0/`/# `!$ '`$.`
4 /` /*` (- ` /# . ` ./)-.` SFGOFHTN` ) ` *!` /# ` (*- ` .0 .!0'`
" )*($` $ )/$!$ -` ./)-$5/$*)` ) 1*0-.` $)'0 .` /# ` 2*-&` *) ` 4` # ` ` ) ` *( )'/0- ` *(($// ` STN` ` #.`
0-/ ` )` ..$") ` 0)$,0 ` " ) ` .4(*'.` )` )( .` /*` *1 -` EEOBBB`
#0()` '*$O` )'$)"` ' -` )` 0)($"0*0.` - ! - )$)"` *!` " ) .` )`
/# - !*- ` '.*` !$'$//$)"` ' /-*)$` /` - /-$ 1'` !-*(` /. .` )`
+0'$/$*).` . ` *)` " ) ` .4(*'.` )` )( .` SFITN` )*/# -` (%*-`
// (+/`!*-`" )*($`$)!*-(/$*)`./)-$5/$*)`$.`/# `2*-&`*)0/ ` 4` /# ` *0.` ! - ) ` )*($` ST` +-*% /N` ` $.` *''*-/$*)`
/2 )`/# `/2*`(%*-`. ,0 ) `+-*1$ -.`S `)` T`)`1-$*0.`
*/# -` " )*($` /. .` )` - . -#` '*-/*-$ .N` # ` `
*''*-/$*)` $(.` /*` +-*1$ ` ./' ` )` 0)$,0 ` - ! - ) .` /*` #0()`
" )*($` . ,0 ) .` /*` ` 0. ` .` ` - ! - ) ` ./)-` !*-` - +*-/$)"`
$. . ]0.$)"`1-$)/.`$)`#0()`" ) .`SFJTN``
#"(@ (@ (-%':` /` $.` )*/` '24.` ' -` #*2` $*'*"$'` )/$/$ .`
.0#` .` ` . ,0 ) .O` " ) .O` (O` - "0'/*-4` ' ( )/.O` +-*/ $).O`
!0)/$*)'` )` ./-0/0-'` //-$0/ .` - ` - '/ ` /*` #` */# -N` # . ` - '/$*).` )` ` *) ]/*]*) ` - '/$*).#$+.` S N"N` +-*/ $)` )` *-$"$)/$)"`
" ) TO` .` 2 ''` .` *) ]/*]()4` S N"N` " ) ` /*` . 1 -'` +-*0 ` +-*/ $).TN`
# 4` )` ` $)*(+' / ` S N"N` " ) ` 3+- ..$*)` ($-*--4` +-* ` - +- . )/$)"` +-/` *!` /-).-$ ` (` *-` *-/#*'*"*0.` " ) .` /2 )`
.+ $ .T`*-`. `*)`+-*$'$/4`S N"N`+- $/ `$)/ -/$*)TN` )`$/$*)O`$/`
$.`)*/`'24.`' -`$!`)`#*2`/# `/`*0'` `*(+- O`!*-` 3(+' `
$)``.$/0/$*)`2# - `4*0`#1 `$!! - )/`/4+ .`*!`/O`.0#`.`,0)/$//$1 ` 1'0 ` *!` " ) ` 3+- ..$*)O` )` ` $.- / ` " )*($` '*0.` - +- . )/$)"` `
$)$)"` .$/ N` )4` /**'.` )` ( /#*.` #1 ` )` 1 '*+ ` !*-`
+ -!*-($)"` /#$.` /4+ ` *!` $)/ "-/$1 ` /` )'4.$.` )` !0.$*)` 0/` ()4`
#'' )" .`- ($)`SFK^GGTN`
(@* ')! .( $#:` )/ "-/$*)` *!` $)!*-(/$*)` !-*(` $!! - )/` .*0- .`
'.*` $)- . .` /# ` *(+' 3$/4` *!` /# ` /N` #$.` $)` /0-)` *(+'$/ .` /# `
$)/ -+- //$*)`)` 3+'*-/$*)`*!`/# `/N`# - !*- `( /#*.`)`/**'.`
- `- ,0$- `!*-`1$.0'$5$)"`/# `/O`/#0.`(&$)"`$/`+*..$' `!*-`#0().`
/*` (*- ` .$'4` $" ./` )` +-* ..` ''` *!` /# ` $)/ "-/ ` $)!*-(/$*)N`
-$*0.` 1$.0'$5/$*)` /**'.` #1 ` )` 1 '*+ ` /*2-.` /#$.` )O` )`
/# . ` $)'0 ` ) /2*-&]. ` /**'.` .0#` .` 4/*.+ ` SGHTO` )` " )*( ` )/ - ` /**'.` .0#` .` /# ` )/ "-/$1 ` )*($.` $ 2 -` S T` SGIT` )`
/# `` )*( `-*2. -`SGJTN`
*( `*!`/# . `#'' )" .`2$''` `$.0.. `$)`"- / -` /$'`'/ -`$)`/#$.`
/# .$.` 0-$)"` /# ` +- . )//$*)` *!` /# ` )*1 '` .*'0/$*).` +- . )/ ` $)` /# `
*-$"$)'`+0'$/$*).N`
`
# -
# `($)`$(.`*!`/# `2*-&`+- . )/ `$)`/#$.`/# .$.`2 - `/*` 1 '*+`) 2`
( /#*.`)`/**'.`!*-`$)/ "-/$)"`)`$)/ -+- /$)"`" )*($`/N`
`
@'% @ "'@+&<@
`
- *` ./04` 3$./$)"` ( /#*.` )` .*!/2- ` /**'.` 1$'' ` !*-`
$)/ "-/$)"`" )*($`/`S0'$/$*)` TN`
`
- *` 1 '*+` ` )*1 '` ( /#*` )` .*!/2- ` /**'` !*-` $)/ "-/$)"`
# / -*" ) *0.`-*..].+ $ .`)`-*..]+'/!*-(`" )*($`/`. /.`
S0'$/$*)` TN`
`
- *` 1 '*+` ` )*1 '` ( /#*` )` .*!/2- ` /**'` !*-` 1$.0'$5$)"`
$)/ "-/ ` " )*($` /` . /.` 0.$)"` /#- ]$( ).$*)'` !*- ]
$- / `"-+#`) /2*-&.`S0'$/$*)` TN`
`
- *` 1 '*+` ` #0()` " ) /$` 1-$/$*)` /. ` +*-/'` /#/`
$)/ "-/ .` /` !-*(` 1-$*0.` " )*($` /. .` /#0.` !$'$//$)"`
.4`$).+ /$*)`*!`'-" `. /.`*!`" ) /$`1-$/$*).`S0'$/$*)` TN`
$ ---
#$.` #+/ -` .-$ .` /# ` $!! - )/` ( /#*.` ++'$ ` $)` /# ` *-$"$)'`
+0'$/$*).` )` '.*` +-*1$ .` ` '$./` *!` /# ` $!! - )/` /` .*0- .` 0. ` /#-*0"#*0/`/# `./0$ .N`
5.1 CROSS-LINKING AND METAGENE INTEGRATION -*..]'$)&$)"`$.``)<1 `( /#*`*!`$)/ "-/$)"`# / -*" ) *0.`/O`)`$)`
$/.` .$(+'$$/4` *).$./.` *!` '$)&$)"` $!! - )/` $ )/$!$ -.` /*` #` */# -N` ` +*+0'-` 3(+' ` $.` '$)&$)"` ` " ) ` /*` /# ` +-*0/.` *!` /#$.` " ) ` S$N N`
/-).-$+/.` )` +-*/ $).TN` -*..]'$)&$)"` $.` *!/ )` 0. ` /*` *)1 -/`
$ )/$!$ -.`!-*(`*) `$ )/$!$ -`.4./ (`/*`)*/# -O`!*-` 3(+' `*)1 -/$)"`
($-*--4`" ) ` 3+- ..$*)`+-* `. /`$ )/$!$ -.`/*`" ) `.4(*'.N``
# `($)`1)/" `*!`-*..]'$)&$)"`$)/ "-/$*)`$.`$/.`.$(+'$$/4O`2#$' `
$/.`($)`$.1)/" `$.`'*./`0-4N`#$.`$.` 1$ )/`2# )`*)1 -/$)"`
!-*(` $ )/$!$ -.` /*` (*- ` " ) -'` $ )/$!$ -.O` !*-` 3(+' ` 2# )` -*..]
'$)&$)"``/-).-$+/`$ )/$!$ -`/*``" ) `.4(*'N` !`/# `" ) `+-*0 .O`.`
)` 3(+' O` / )` $!! - )/` /-).-$+/.O` !/ -` /# ` *)1 -.$*)` /*` ` " ) ` .4(*'O` $/` $.` )*` '*)" -` +*..$' ` /*` $./$)"0$.#` /2 )` /# ` $!! - )/`
/-).-$+/.O` )` /# - !*- ` ))*/` *)1 -/` /# ` " ) ` .4(*'` &` /*` /# ` .( ` /-).-$+/` $ )/$!$ -N` 0'$/$*)` ` *)/$).` ` (*- ` /$' ` 3+')/$*)` *0/` -*..]'$)&` $)/ "-/$*)O` )` ` *(+-$.*)` *!` +0'$'4`
1$'' `*)]'$) `-*..]'$)&$)"`/**'.N`
`/**'`+- . )/ `$)`/# `0'$/$*)` `$(+' ( )/.``1-$/$*)`
*!` /# ` -*..]'$)&$)"` $)/ "-/$*)O` / -( ` ( /" ) ` $)/ "-/$*)N` # `
*) +/` *!` ( /" ) ` $)/ "-/$*)` $.` . ` *)` - /$)"` ` ) 2` *) +/0'`
" ) ` '' ` ` Y( /" ) ZO` 2#$#` $.` /# )` -*..]'$)& ` /*` *-- .+*)$)"`
" ) .` $)` $!! - )/` .+ $ .O` )` /#-*0"#` /# ` " ) .O` /*` $!! - )/` " ) ` +-*0/.`)`$ )/$!$ -.N` )``. ). O`''`/# `$!! - )/`*-/#*'*".`*!``" ) ` )`/# $-`" ) `+-*0/.`- `*''+. `$)/*``.$)"' `( /" ) `S$"0- `DTN`
$)"`' `/*`*)1 -/`$!! - )/`" )*($`$ )/$!$ -.`/*`0)$1 -.'`( /" ) `
$ )/$!$ -.` "- /'4` .$(+'$!$ .` /# ` /.&` *!` $)/ "-/$)"` # / -*" ) *0.` /O`
/#*0"#`/# `'*./`0-4`$.``(%*-`*) -)`.$($'-'4`/*`*/# -`-*..]'$)&`
$)/ "-/$*)`( /#*.N`
`
5.2 DATA-ANALYSIS METHODS
#$.` . /$*)` -$ !'4` .-$ .` /# ` 1-$*0.` /])'4.$.` )` .//$./$'`
( /#*.`++'$ `$)`/# `*-$"$)'`+0'$/$*).N``
@ '(#&@ '$&@ =.?'$&>` ( /#*` 2.` 0. ` /*` ./)-$5 ` 1'0 .`
!-*(` # / -*" ) *0.` /` . /.` +-$*-` /*` )'4.$.` $)` 0'$/$*)` N` # ` 5]
.*- `$)$/ .`#*2`()4`./)-` 1$/$*).`)`*. -1/$*)`$.`*1 `*-`
'*2` /# ` ( )O` )` $.` /# - !*- ` ` 0. !0'` ( /#*` 2# )` *($)$)"`
1'0 .` !-*(` # / -*" ) *0.` .*0- .` 2# - ` /# ` .' ` )` $./-$0/$*).`
$!! -N` /)-$5 ` 5].*- ` $.` '0'/ ` 4` .0/-/$)"` /# ` +*+0'/$*)`
( )`!-*(`)`$)$1$0'`-2`.*- `)`/# )`$1$$)"`/# `$!! - ) `4`
/# `+*+0'/$*)`./)-` 1$/$*)N`SGKT`
!?$&# . #@"%@=>`$.``/4+ `*!`-/$!$$'`) 0-'`) /2*-&`/#/`
)` ` 0. ` /*` *-")$5 ` .(+' .` /*` ` '*2]$( ).$*)'` /*+*'*"$'`
- +- . )//$*)N``. '!]*-")$5$)"`(+`*).$./.`*!`)* .O`2#$#`0-$)"``
/-$)$)"`+#. `- `/-$) `/*`- +- . )/`$./$)/$1 ` ' ( )/.`*!`/# `/-$)$)"`
/N`# )`+*+0'/$)"`/# `(+O`.(+' .`- `$./-$0/ `$)`/# `(+`.*`
/#/`/# 4`- `'*. `/*`)* .`.$($'-`/*`/# (. '1 .N`#$.`2$''`- .0'/`$)`)`
--)" ( )/`*!`/# `.(+' .`2# - `.$($'-`.(+' .`- `"-*0+ `/*" /# -O`
!$'$//$)"` '0./ -` )'4.$.N` #$.` /4+ ` *!` )'4.$.` #.` )` .0 ..!0''4`
Figure 2. Conceptual illustration of metagenes. Essentially all related genomic identifiers are collapsed into a single metagene identifier, resulting in ease of integration and loss of accuracy.
0. ` 2$/#` " ) ` 3+- ..$*)` ($-*--4` /` SHBOHCTO` )` 2.` 0. ` /*`
'0./ -`.(+' .`$)`0'$/$*)` N`
#@'(@#& "#(@#!-' '@=>`$.``"-*0+`*!`( /#*.`2# - ``
. /`*-`-)& `'$./`*!`" ) .`$.`$).+ / `!*-`*1 -]`*-`0) -]- +- . )//$*)`
*!` "$1 )` /# ( .` 2# )` *(+- ` /*` ` &"-*0)` . /` *!` " ) .O` !-*(`
2# - ` /# ` " ) ` . /` *-` '$./` 2.` *-$"$)''4` -2)` S N"NO` - ` (*- ` " ) .`
'$)& `/*`` -/$)`+/#24`/#)`4*0`2*0'` 3+ /`4``-)*(`#) T`
SHDOHETN` ` )'4.$.` $.` *!/ )` + -!*-( ` 2# )` - . -# -.` 2)/` /*`
$).+ /`$!`/# $-`" ) `. /\'$./`*/$) `/#-*0"#`)` 3+ -$( )/`$.` )-$# ` 2$/#` - "-.` /*` $!! - )/` +/#24.O` $*'*"$'` !0)/$*).O` #-*(*.*('`
'*/$*).` *-` $. . .N` )` 0'$/$*)` O` $!! - )/$''4` 3+- .. ` " ) .`
2 - ` ./0$ ` !*-` )-$#( )/` . ` *)` ) ` )/*'*"4` ST` / -(.` )`
`+/#24.`0.$)"` `SHFT`)``SHGT`/**'.N`
5.3 FORCE-DIRECTED GRAPHS
*- ]$- / `"-+#.`- `)`$)/0$/$1 `24`*!`1$.0'$5$)"`) /2*-&`"-+#.`
$)` )` ./# /$''4` +' .$)"` ()) -N` )` $/$*)` /*` 1$.0'` +-*+ -/$ .O`
!*- ]$- / ` "-+#.` ''*2` ..$")( )/` *!` +#4.$'` +-*+ -/$ .` /*` /# ` )* .` )` " .` *!` /# ` "-+#` SHHTN` )` /# ` .*!/2- ` /**'` E`
+- . )/ ` $)` 0'$/$*)` O` $/' ` 1$.0'` //-$0/ .` $)'0 ` /# ` *'*-O`
.$5 `)`.#+ `*!`/# `)* .O`)`*'*-O`2$/#`)`$- /$*)`*!`/# ` " .O`
2#$' ` +#4.$'` //-$0/ .` $)'0 ` (..` )` ' /-$` *)./)/` !*-` )* .O`
)` .+-$)"` *)./)/` !*-` " .N` # ` " .` - ` (* ' ` .` .+-$)".O` )`
)* .` .` ' /-$''4` #-" ` +-/$' .N` #$.` ''*2.` (* '$)"` *!` /# ` ) /2*-&`.``+#4.$'`.4./ (O`2# - `)* .`)` " .`- `(* ' `2$/#`
.$` '2.` *!` +#4.$.` S**& X.` '2` !*-` " .` )` *0'*(X.` '2` !*-`
)* .TN`# `!*- .`- `++'$ `/*`/# `)* .O`+0.#$)"`/# (`!-/# -`24O`
2#$' `/# ` " .`*)./-$)`/# $-`(*1 ( )/N``
*0'*(X.`'2`.// .`/#/`/# ` ' /-*.//$`!*- ` /2 )`/2*`#-" ` +-/$' .`S)* .T`)` `+- . )/ `.`Fc= keq1q2
r2 O`)`/# `- ./*-$)"`!*- `
*!``.+-$)"`S " T`. `*)`**& X.`'2`)` `+- . )/ `.`Fh = −kskrO`
2# - ``$.`/# `$./) ` /2 )`/# `)* .O``)`!`- `/# $-`#-" .O``$.`
/# `.+-$)"`*)./)/`*!`/# `*)) /$)"` " O`2#$' ``)``- `/# `"'*'`
' /-$` )` .+-$)"` *)./)/.N` # )` /# ` .$(0'/$*)` $.` -0))$)"O` /# ` +-/$' .`/-4`/*`#$ 1 ``$./) `2# - `/# . `!*- .`- `$)` ,0$'$-$0(O`
/#$.` $./) ` )` ` +- . )/ ` .` r= keq1q2
−ksk
3 N` # ` "'*'` (+$)"`
*)./)/` - +- . )/$)"` !-$/$*)` $.` .0/-/ ` !-*(` /# ` !*- .` 0.$)"` /# `
!*''*2$)"`!*-(0'`(+*`2# - `,`$.`/# `"'*'`(+$)"`*)./)/`)``
$.` /# ` 1 '*$/4N` # ` .$(0'/$*)` 2*-&.` 4` /&$)"` /# ` !*- .` . ` *)`
*0'*(X.` )` **& X.` '2` )` ..$")$)"` /# (` /*` 2/*)X.` '2` *!`
(*/$*)`(N` 2/*)X.`2.` )' .`- '/$)"`/# `+*.$/$*)O`1 '*$/4`)`
' -/$*)` *!` /# ` .$(0'/ ` )* .` .` ` $!! - )/$'` ,0/$*)` !*-` /# ` 0)&)*2)` +*.$/$*)` *!` /# ` )* ` .` ` !0)/$*)` *!` /$( N` 0( -$'`
$)/ "-/$*)` )` /# - !*- ` ` 0. ` /*` .*'1 ` /# ` $!! - )/$'` ,0/$*)` )`
1) `/# `.$(0'/$*)`4``"$1 )`/$( `./ +N`
)` EO` /#$.` .$(0'/$*)` $.` 1$.0'$5 ` $)` /#- ]$( ).$*)` $)` - ']
/$( `''*2$)"`0. -.`/*`. `#*2`/# `$!! - )/`!*- .`++'4`/*`/# `!*-($)"`
*!`/# `) /2*-&O`)`'.*`$)/ -/`2$/#`/# `.$(0'/$*)`/*`. `#*2`(*1$)"O`
$/$)"`*-`- (*1$)"`)* .`*-` " .`!! /.`/# `!*-(/$*)`)` #1$*-`*!`
/# `) /2*-&N`
5.4 SOFTWARE DEVELOPMENT TOOLS
$!! - )/`.*!/2- ` 1 '*+( )/`/**'.`)`+-*"-(($)"`')"0" .`2 - ` 0. `2# )`+ -!*-($)"`/# `./0$ .`)` 1 '*+$)"`/# `- '/ `.*!/2- N`
&!` +-*"-(($)"` ')"0" ` SHIT` 2.` 0. ` !*-` !$'$//$)"` / 3/]!$' ` ()" ( )/O` +-.$)"` )` ( -"$)"` $)` 0'$/$*).` ` )` N` -'` 2.`
'.*`0. `!*-`/# `$(+' ( )//$*)`*!`/# ``.*!/2- `S0'$/$*)`
TN` X.` 2 ` 0. -]$)/ -! ` $.` ` -'` . ` *((*)` / 24`
)/ -! ` S T` .*!/2- ` /#/` $)/ -/.` 2$/#` ` -'` . ` & )N` # `
& )` 0/$'$5 .` $*+ -'` SHJT` )` ). ('` -'` ` SHKT` +&" .` !*-`
#)'$)"` /# ` $*'*"$'` $)!*-(/$*)` )` - /-$ 1$)"` /` !-*(` ` '*'`
$)./''/$*)`*!`/# `). ('`/. `SIBTN`
-`- '/$*)'`/. `()" ( )/`.4./ (`SICT`2.`0. `$)`/# `
` )` -$ /.` .*!/2- ` /**'.` S0'$/$*).` ` )` TN`
` 0/$'$5 ` ` '*'` *+4` *!` /# ` ). ('` /. ` SIBTO` 2#$' ` -$ /.`0/$'$5 ``0./*(`$)/ "-/ `/. `'' `-$ /.N`
`+-*"-(($)"`')"0" `SIDT`2.`0. `!*-`$(+' ( )/$)"`/# `2 ` 0. -]$)/ -! ` *!` /# ` -$ /.` /**'` S0'$/$*)` TN` -$ /.X` 0. -]
$)/ -! `- /-$ 1 .`/`!-*(`/# `-$ /.`/. `. `*)`/# `0. -X.`
,0 -$ .N`
`-*% /`!*-`//$./$'`*(+0/$)"`SIET`2.`0. `$)`0'$/$*)` `!*-`
- /-$ 1$)"`)`*($)$)"`/`!-*(`/# `). ('`$*(-/`/. `0.$)"`
$*(/`SIFT`$**)0/*-`SIGT`+&" N`
@ 99` *(+$' -` SIHT` 2.` 0. ` !*-` 1 '*+$)"` /# ` E`
.*!/2- ` S0'$/$*)` TN` + )` "-+#$.` '$--4` SIIT` 2.` 0. ` !*-`
$(+' ( )/$)"`/# `"-+#$'`0. -`$)/ -! `S T`)`E`1$.0'$5/$*)N`
5.5 DATA SOURCES
# ` 1 '*+ `.*!/2- `/**'.`$)/ "-/ `)`0/$'$5 `/`!-*(``1-$ /4`*!`
+0'$` /` .*0- .O` 2#$#` - ` -$ !'4` .-$ ` $)` ' ` EN` # . ` /`
.*0- .`- `0/$'$5 `$)`1-$*0.`24.`/#-*0"#*0/`/# `*-$"$)'`+0'$/$*).O`
*((*)'4` .` $)$/$'` .*0- .` *!` /` *-` .` 3/ -)'` - .*0- .` !*-` !0-/# -`
$)!*-(/$*)`*0/`. ' / `+-/.`*!`/# `/N``
`
Table 3. List of used data sources.
Name Description ArrayExpress Database of functional genomic
experiments
Ensembl Genome database
Gene Ontology (GO) Database of gene and gene product attributes
Genetic Association Database (GAD) Database of human genetic association studies
NCBI Entrez Gene Gene database
NCBI Entrez SNP Database of small genomic variations
NCBI GEO Gene expression database
NCBI OMIM Catalog of human genes and genetic disorders
NCBI Pubmed Biomedical literature citation database
NHGRI GWAS Catalog Catalog of Published Genome-Wide Association Studies
SNPedia Wiki for human SNP information WikiGenes Wiki for gene information
WormBase C. elegans genome database
`
% -
#$.`#+/ -` .-$ .`- .0'/.`!-*(`/# `*-$"$)'`+0'$/$*).`+- . )/ `$)`
/#$.`/# .$.O`2#$' `$"0- `E`$''0./-/ .`#*2`/# . `./0$ .`- '/ `/*`*((*)`
./ +.` $)` )'4.$.` *!` $)/ "-/ ` /N` 0'$/$*).` O` ` )` ` !*0.` *)`
*($)$)"` /O` 0'$/$*)` ` !*0. .` *)` 1$.0'$5/$*)` *!` *($) ` /O` 2#$' ` 0'$/$*).` ` )` ` '.*` +-*1$ ` ( /#*.` )` /**'.` !*-`
$)/ -+- /$)"` /# ` - .0'/.` !-*(` /# ` /])'4.$.N` -$"$)'` +0'$/$*).` ` )` `'.*`*)/$)`-$ !` 3 (+'-4`/`)'4. .N@
``
`
6.1 EXISTING DATA INTEGRATION SOFTWARE TOOLS
# ` 2*-&` +- . )/ ` $)` 0'$/$*)` ` '4.` *0/` /# ` "-*0)2*-&` !*-` /# `
*/# -`./0$ .`$)'0 `$)`/#$.`/# .$.N``# `($)`- .*)`!*-`$)$/$/$)"`/#$.`
./04`2.`/*`" /`)`*1 -1$ 2`*!`/# `1$'' `" )*($`/`$)/ "-/$*)`
.*!/2- `/**'.O`)`/*`.0((-$5 `/#$.`$)!*-(/$*)`!*-``2$ -`0$ ) O`
.`2 ''`.`0. `$/`.`/# `.$.`!*-`+'))$)"`*!`*0-`*2)`.*!/2- `/**'.N`
# ` +0'$/$*)` .-$ .` /# ` $!! - )/` ( /#*.O` ./)-.` )` /**'.`
!*-`" )*($`/`$)/ "-/$*)O` .+ $''4`!*0.$)"`*)`-*..]'$)&`$)/ "-/$*)`
2# - ` $!! - )/` /4+ .` *!` " )*($` $ )/$!$ -.` - ` -*..]'$)& ` /*` #`
*/# -N` .$ .` $)/-*0$)"` /# ` 1$'' ` ( /#*.O` ./)-.` )` /**'.O`
/# ` ./04` - 1$ 2.` $"#/` *)]'$) ` /` $)/ "-/$*)` /**'.` SHFOIJ^JFT` )`
*(+- .` /# (` . ` *)` -$/ -$` .0#` .` 0.$'$/4O` -*..].+ $ .` )`
-*..]+'/!*-(` !0)/$*)'$/4O` - .0'/` +-* ..$)"` )` 1$'$'$/4` *!`
@
Figure 3. Common steps in analysis of integrated data and how the presented studies relate to these steps. In practice these steps are usually iterated several times during an analysis.
$!! - )/`$ )/$!$ -.`)`/`/4+ .N`# . `*)]'$) `$)/ "-/$*)`/**'.`2 - ` . ' / `. `*)`0 `'$/ -/0- `. -# .O`)`*)'4`+0'$'4`1$'' `
*)]'$) `- .*0- .`0/$'$5$)"`-*..]'$)&`$)/ "-/$*)`2 - `. ' / `!*-`- 1$ 2N`
# `./04`'.*`#$"#'$"#/.`.#*-/*($)".`)`2 &) .. .`*!`/# `1$'' ` /**'.O` )` .0"" ./.` #*2` /# . ` /**'.` *0'` ` $(+-*1 N` ) ` *!` /# . ` .0"" ./$*).` $.` )` (+#.$.` *)` /# ` ./)-$5/$*)` *!` #*2` " )*($`
$)!*-(/$*)`$.`./*- `)`- ! - ) O`)`/# `.0"" ./ ` .$")`!*-`/# . ` ./)-.` 2*0'` $)'0 ` (* '` *!` /# ` /O` *)/-*'' ` 1*0'-4` !*-`
.-$$)"`/# `/O`)`]. `(-&0+`')"0" `- / `!-*(`/# ` (* '`)`1*0'-4N``
`
. `*)`/# `./04O`/# `!*''*2$)"`! /0- .`2 - `!*0)`/*` ` .$-' `$)``
" )*($`/`$)/ "-/$*)`/**'P`
- **` *1 -" ` *!` /` S N"N` .0++*-/ ` .+ $ .O` / #)*'*"$ .` )`
/4+ .`*!`" )*($`$)!*-(/$*)T`
- )/0$/$1 `)`!-$ )'4`0. -]$)/ -! ` - "0'-`0+/ .`*!`/`*)/ )/`
- '$' `1$'$'$/4`*!`/# `. -1$ `
- /#`+-* ..$)"`*!`'-" `(*0)/.`*!`/`
- *..$$'$/4`/*`$)+0/`/`$)`1-$*0.`!*-(/.`
- *..$$'$/4`/*`0./*($5 `- .0'/.`*0/+0/`
- *..$$'$/4`/*`+- 1$ 2`/# `- .0'/.`$)``2 `-*2. -`)`*2)'*`
/# (`.``. +-/ `!$' `
- ++'$/$*)` +-*"-(($)"` $)/ -! ` S T` )\*-` $- /` /. ` ..`!*-`0.$)"`/# `/**'`+-*"-((/$''4`
`
# `($)`- .0'/`*!`/# `./04`$.`/# `- '$5/$*)`/#/`/# `!$ '`'& ``/**'`
/#/`2*0'` `0.' `!*-`$)/ "-/$*)`*!`" )*($`/`!-*(`2$ `1-$ /4`
*!`- . -#`/ #)*'*"$ .`)`.+ $ .O`)`/# `'$./`*!` .$-' `! /0- .`!*-`
.0#``/**'N`
# ` +0'$/$*)` #.` )` - ! - ) ` 1-$*0.` /$( .O` .+ $''4` .` )`
3(+' ` *!` $*$)!*-(/$.` ++-*#` 0. ` $)` +#-(*'*"$'` - . -#`
SJG^JJTN``
.0'/.`!-*(`/#$.`./04`2 - `0. `2# )` .$")$)"`)`$(+' ( )/$)"`
) 2`( /#*.`)`/**'.`- +- . )/ `$)`0'$/$*).` ] N`
6.2 CROSS-SPECIES AND -PLATFORM DATA INTEGRATION
0'$/$*)` ` .-$ .` ` ( /#*` )` .*!/2- ` /**'` !*-` -*..]'$)&$)"`
$)/ "-/$*)`0.$)"`( /" ) .N``# `-/$*)' `!*-` 1 '*+$)"`/# `( /" ) ` ( /#*`)`/# `..*$/ ``/**'`2.`/*`- / `)` .$'4`0.' ` /**'`/#/`2*0'`!$'$// `*($)$)"`-*..].+ $ .`/`!-*(` 3+ -$( )/.`
*)0/ `*)`1-$*0.`($-*--4`" ) ` 3+- ..$*)`+'/!*-(.N`# `' ..*).`
' -) `2#$' `2*-&$)"`2$/#`0'$/$*)` `*0/` .$-' `/`$)/ "-/$*)`
/**'`! /0- .`2 - `/& )`$)/*`*0)/`2# )` .$")$)"`)`$(+' ( )/$)"`
/# `.*!/2- N`0-$)"`/# `*0-. `*!` 1 '*+( )/`/# `.*+ `*!`/# `/**'`2.`
3+) ` /*` '.*` ''*2` $)/ "-/$*)` *!` */# -` /4+ .` *!` " )*($`
$)!*-(/$*)O` .0#` .` ` . ,0 ) .` )` +-*/ $).N` ) ` *!` /# ` (%*-`
.$")` "*'.` 2.` /*` )' ` $)/ "-/$*)` *!` +0'$'4` 1$'' ` " ) ` 3+- ..$*)` ($-*--4` /` . /.` /*` ) 2` /` +-*0 ` 4` *0-` *2)`
3+ -$( )/.N`
/" ) .` - ` $ )/$!$ -.` /#/` "-*0+` /*" /# -` ''` $!! - )/` $ )/$!$ -.`
'$)& `/*``.$)"' `" ) `)`$/.`+-*0/.O`.`2 ''`.`*-/#*'*"*0.`" ) .`)`
/# $-` +-*0/.` $)` $!! - )/` .+ $ .N` # ` .*!/2- ` /**'O` O`
+-*1$ .` )` .4` )` ,0$&` 24` *!` + -!*-($)"` -*..]'$)&$)"` *!`
# / -*" ) *0.` $ )/$!$ -.O` .0#` .` $!! - )/` " ) ` )` " ) ` +-*0/`
$ )/$!$ -.`!-*(`$!! - )/`/ #)*'*"$ .O`/. .`)`.+ $ .`/*`*((*)`
( /" ) ` $ )/$!$ -.N` /` /# )` !$'$// .` *($)$)"` *!` /# . ` ( /" ) `
$ )/$!$ -.O`!0-/# -` )'$)"`/# `+ -!*-() `*!`$)/ "-/$1 `-*..]+'/!*-(`
)`-*..].+ $ .`./0$ .`S$"0- `FTN`
# ` *-$"$)'` +0'$/$*)` '.*` $)'0 .` ` -$ !` 3 (+'-4` )'4.$.O`
2# - ` -&$).*)X.` $. . ` /` !-*(` $!! - )/` # / -*" ) *0.` .*0- .`
.0#` .` $!! - )/` / #)*'*"4` +'/!*-(.` S+-*/ $)` --4` )` " ) ` 3+- ..$*)` ($-*--4.T` )` .+ $ .` S#0()O` (*0. O` )- ` )`
(,0 T` - ` *($) N` # ` )'4.$.` "-*0+ ` /# ` /` $)/*` FOBGG`
*((*)` ( /" ) .O` *!` 2#$#` DFI` 2 - ` $!! - )/$''4` 3+- .. ` $)` /# `
#0()` -&$).*)` $. . ` /` )` $)` /# ` )$('` -&$).*)` $. . ` (* '`/`. /.N`# `)'4.$.`.#*2. .`#*2`/# `( /" ) `++-*#`)`
` 0. ` /*` $ )/$!4` "-*0+.` *!` *]- "0'/ ` " ) .` )` +-*/ $).` $)`
-&$).*)X.` $. . ` )` $. . ` (* '.O` )` +-*1$ .` ` /**'` !*-`
#4+*/# .$.` - /$*)` )` !0-/# -` 1'$/$*)` *!` )'4.$.` - .0'/.` 4`
*($)$)"`/`!-*(`+0'$'4`1$'' `/`. /.N``
# ` ($)` - .0'/` !-*(` /# ` ./04` $.` /# ` 1 '*+( )/` *!` /# ` ( /" ) ` `
$)/ "-/$*)` '"*-$/#(O` .-$ ` $)` /# ` / -$'.` )` /#*.` . /$*)O`
)` /# ` $(+' ( )//$*)` *!` /#$.` '"*-$/#(` .` ` +-/` *!` /# ` 0. -]!-$ )'4`
`2 /**'N` )`*0-`*2)`0. `/# `/**'`#.` )`.0 ..!0''4`0. `
!*-` !$'$//$)"` 1-$*0.` ./0$ .` *($)$)"` -*..].+ $ .` /O` .+ $''4`
($-*--4`" ) ` 3+- ..$*)`/`!-*(`)-`)`#0()` 3+ -$( )/.N``
# ` +0'$/$*)` #.` '.*` )` $/ ` .` )` 3(+' ` *!` -*..].+ $ .`
$)/ "-/$*)`/**'`SJKOKBTN`
6.3 VISUALIZATION OF INTEGRATED GENOMIC DATA
$.0'$5/$*)` $.` *) ` *!` /# ` (%*-` #'' )" .` 2# )` 2*-&$)"` 2$/#`
$)/ "-/ `" )*($`/O`($)'4` 0. `/# `'-" `(*0)/`*!`/`)`$/.`
Figure 4. Screenshot of CROPPER. Metagene identifiers (first column) have been created for each row in the original dataset allowing using the column as a common key for combining the dataset with others.
*(+' 3` ./-0/0- ` (& .` $)/ -+- //$*)` *!` /# ` /` ` ()$)"` /.&N`
$!! - )/`1$.0'$5/$*).`# '+`- . -# -.`/*`0) -./)`)` 3+'*- `/# . ` ./-0/0- .` )` /*` " /` ` // -` "-.+` *!` 2#/` $!! - )/` +-/.` *!` /# ` /`
/0''4` ( )` /# ` $)` /# ` *)/ 3/` *!` /# ` *-$"$)'` - . -#` ,0 ./$*).N` *-`
$)/ "-/ `" )*($`/O`1$.0'$5/$*)`*!`) /2*-&`"-+#.`($"#/` `*) `*!`
/# `(*./`$(+*-/)/`)`0. !0'`- .`*!`1$.0'$5/$*)N`# `- .*)`!*-`/#$.`
$.`/#/`()4`+# )*( )`$)`" )*($.`)` `- +- . )/ `.`"-+#.O`!*-`
3(+' ` $!! - )/` .$")'$)"` +/#24.` .0#` .` " ) ` )` +-*/ $)`
$)/ -/$*).` SGHTN` )` $/$*)` '(*./` )4` &$)` *!` /` . /` )` ` - +- . )/ `.``"-+#O` 0. `*-- '/$*).O`..*$/$*).O`)`$!! - )/`
$./) `( /-$.`)` `$)/ -+- / `.`"-+#.N`
`
` `
Figure 5. User-interface of FORG3D, including a network containing nodes and edges of different shapes, colors and physical properties.