Sie sind auf Seite 1von 24

Forensic DNA Phenotyping: Predicting human appearance from crime

scene material for investigative purposes

Forensic DNA Phenotyping refers to the prediction of appearance traits of unknown
sample donors, or unknown deceased (missing) persons, directly from biological
materials found at the scene. Biological witness outcomes of Forensic DNA
Phenotyping can provide investigative leads to trace unknown persons, who are
unidentiable with current comparative DNA proling. This intelligence application
of DNA marks a substantially different forensic use of genetic material rather than
that of current DNA proling presented in the courtroom. Currently, group-specic
pigmentation traits are already predictable from DNA with reasonably high
accuracies, while several other externally visible characteristics are under genetic
investigation. Until individual-specic appearance becomes accurately predictable
from DNA, conventional DNA proling needs to be performed subsequent to
appearance DNA prediction. Notably, and where Forensic DNA Phenotyping shows
great promise, this is on a (much) smaller group of potential suspects, who match
the appearance characteristics DNA-predicted from the crime scene stain or from
the deceased persons remains. Provided sufcient funding being made available,
future research to better understand the genetic basis of human appearance will
expectedly lead to a substantially more detailed description of an unknown persons
appearance from DNA, delivering increased value for police investigations in
criminal and missing person cases involving unknowns.
1. Forensic DNA Phenotyping: some general considerations
Forensic DNA analysis, i.e., the identication of persons via short tandem repeat
(STR) prole matching of unknown evidence material with reference material from
known persons, has been considered the golden standard in forensic sciences [1].
However, one of the major limitations of this comparative approach of DNA
identication, likewise applying to STRs and single nucleotide polymorphisms (SNP),
is that it typically fails to identify persons whose STR or SNP prole is not already
known to the investigators. Persons may be unavailable for comparative DNA prole
matching because they have successfully escaped police investigations and thus
avoided becoming a known suspect. Although this current approach becomes more
effective whenforensic DNA (prole) databases are in place [2], cases where the
evidence DNA prole does not match that of any known person including all stored
in the forensic DNA (prole) database are routinely seen by investigators. In the
absence of any other information that provides leads for tracing unknown forensic
sample donors, cold cases can wait for various periods of time (sometimes for very
long), before the evidence STR prole is matched with a known person subsequently
added to the grown forensic DNA database or delivered as suspect by police reinvestigation of the given case.
DNA mass screenings can be carried out in cases where no DNA prole match is
obtained and no other evidence is available [3]. In such DNA dragnets, larger

number of persons (hundreds to thousands), usually those living in the geographic

region where the crime occurred, are invited to voluntarily provide a saliva sample
for STR proling. Although the true perpetrator may not participate voluntarily, due
to awareness of the provided sample leading to identication, non-participation may
raise suspicion and thus directing investigators towards additional leads. If the true
perpetrator does not participate but only close relatives do, familial search is able to
identify them, which provides investiga- tive leads to nd the unknown perpetrator.
Using conventional autosomal STR proling in the DNA dragnet limits the
possibilities of familial search to close relatives of the unknown, non-participating
perpetrator, which can be overcome by using Y-chromosomal STRs instead (if the
evidence DNA originates from a male perpetrator) [4]. Since a Y-STR prole
identies a man together with all his paternal male relatives, close and distant ones,
a Y-STR dragnet is more effective than dragnets based on autosomal STRs (or SNPs).
For instance, a large Y-STR dragnet involving thousands of local volunteering men
nally led to solving a murder case in the Netherlands after 13 years of
investigation [5]. Still, in order to be potentially successful, close and/or distant
relatives of the true perpetrator (if not the perpetrator himself) have to participate
in the DNA mass test. The local presence of relatives may be more likely in rural
areas, where relatives are less likely to migrate away, than in urban areas. In
general, however, such DNA dragnets without specic cause and evidence to ask
volunteers are often seen critically due to ethical concerns, and in some countries
are legally forbidden. Furthermore, the economic burden to obtain STR proles of
hundreds or even thousands of individuals in a single case is high. Because of these
reasons, DNA dragnets are not applied often [35].
These limitations of comparative DNA proling stimulated a relatively new
development within forensic genetics, i.e., Forensic DNA Phenotyping (FDP) [6,7].
FDP aims to infer the unknown stain or sample donors externally visible
characteristics (EVCs) from DNA (or other molecular biomarkers) directly from the
biological material left behind at the scene of crime, or obtained from unknown
bodies. In essence, FDP outcomes can serve as biological witness, and may
potentially provide even more accurate information than human eyewitnesses do,
who are known to be unreliable [8]. As such, FDP is expected to provide
investigative leads allowing to trace unknown perpetrators, who are not identiable
via conventional comparative DNA proling. FDP is also expected to be useful for
missing persons identica- tion, i.e., in cases where reference DNA prole from
putative ante-mortem samples, or from putative relatives are unavailable. The DNA
inference of bio-geographic ancestry (see Philipps in this issue) is sometimes
considered part of FDP [7]; however, genetic ancestry does not always portray an
externally visible characteristic, particularly in individuals of mixed genetic ancestry.
Appearance prediction from DNA for forensic usage started in the early 2000s and
rst progressed very slowly. The main reason for the relatively late introduction of
forensic appearance prediction from DNA is the (still) limited knowledge about the

genetics of most human EVCs. Even though it takes the same technological
equipment and statistical methods to identify disease genes as to nd EVC genes,
our knowledge about inherited diseases is currently more advanced [9] than on how
we look. One of the reasons for limited appearance genetic knowledge till today
might be related to research funding strategies that typically focus more on
disease-related variation than on normal human variation and its genetic
exploration. Of all EVCs, those that involve pigmentation i.e., variation in the
coloration of the human iris, head hair, and (less so) skin, are the best and currently
the only examples of practical FDP (see below). Although all EVCs are considered
complex traits, where several to many genes are contributing to the phenotype
together with environmental factors, human pigmentation traits in general seem the
least genetically complex of all EVCs, with a few handful of genes providing most of
the phenotypic information, at least on a broad categorical level. Therefore,
understanding the genetic basis of pigmentation traits is currently more advanced
than for any other EVC, and thus is DNA-based pigmentation prediction. All other
EVCs are, based on current knowledge or expectations developed from current
knowledge, genetically much more complex with dozens to expectedly thousands of
genes contributing, which complicates the identication of responsible genes and
predictive DNA markers.
The problem with highly complex genetic traits, as realized for many common
diseases, is that every individual gene contributes only a small proportion of the
phenotypic variance, and only the combination of a large number of genetic factors
may explain the overall inherited component [10]. Moreover, the larger the
environmental component, the less can be explained by DNA, and of course any
non-genetic contribution can never be explained by a DNA test. According to
anecdotal knowledge, and based on previous ndings from twin heritabil- ity studies
[11], human EVCs typically carry a large genetic component, but environmental
impacts also exist, for some EVCs more so than others. If however a gene only has a
small individual effect on the phenotypic trait, it is difcult to be identied with the
current toolbox used by genetic epidemiol- ogists, because the measurable
statistical signal is minutely small. Therefore it requires the use of large sets of
individuals to identify such small genetic effects with the needed level of statistical
signicance. Since the genomic tools used for nding genes, such as SNP
microarrays, are still expensive (i.e., approx. 250 EUR per individual sample, and
exome or whole genome sequencing are by magnitudes more expensive), carrying
out genome-wide association studies (GWASs) on large numbers of individuals (i.e.,
tens of thousands) with large numbers of single nucleotide polymorphisms (SNPs)
(i.e., hundreds of thousands and more) quickly becomes unaffordable for the
average single laboratory. The formation of large international consortia, has
demonstrated to be highly successful in nding complex trait genes, mostly
common complex diseases, by combining impressively large numbers of samples
(up to hundreds of thousands) [9]. Consequently, given the complex genetic nature

of EVCs, only large collaborative efforts will allow unveiling their genetic basis as a
prerequisite for developing predictive DNA markers and tools for practical FDP.
2. DNA phenotyping of pigmentation traits: the rst FDP success story
In the following three sub-chapters I summarize the current knowledge on DNAbased prediction of eye, hair, and skin color, respectively. Due to space constrains,
and because it is the predictive value of a SNP that is relevant for FDP purposes, I
mostly leave out association and linkage studies on human pigmentation traits.
Table 1 lists all SNPs previously applied for eye and/or hair and/or skin color
prediction from DNA.
2.1. Eye color
The rst two studies that performed DNA-based iris (eye) color prediction were
published in 2007. Frudakis et al. [12] used 33 SNPs from the OCA2 gene, which
allowed them to classify 8% of the eye colors observed among >1000 samples.
Sulem et al.
[13], embedded in the rst GWAS on human pigmentation traits, used 9 SNPs from
6 genomic regions (SLC24A4, KITLG, 6p25.3, TYR, OCA2HERC2, and MC1R) which
they identied with signicant eye color association among several thousand
Europeans, for categorical eye color prediction. Of the individuals DNA-predicted
with <0.2 probability for brown and <0.1 probability for green, about 90% were
indeed blue eyed, and of the individuals DNA- predicted to be brown with >0.5
probability, about 60% were indeed brown eyed. In 2008, three parallel studies [14
16] reported the HERC2 gene as the most important eye color gene. Sturm et al.
[14] and Eiberg et al. [15] highlighted HERC2 rs12913832 as a major eye color
predictor, while Kayser et al. [16], due to the SNP content of the microarrays used in
their GWAS, highlighted several other HERC2 SNPs such as rs916977. Sturm et al.
[14] reported an R2 value (see Box 1) of 0.68 for HERC2 rs12913832 alone. Eiberg
et al. [15] noted a particular h-1 haplotype based on 13 SNPs from the OCA2HERC2
region, including HERC2 rs12913832, but also others such as HERC2 rs916977,
being present in 97% of the analysed persons with blue eyes. Kayser et al. [16],
who singled-out the HERC2 gene via GWAS, additionally performed formal DNAbased prediction of eye color using 3 SNPs (HERC2 rs916977, OCA2 rs11855019,
and OCA2 rs7495174). The authors obtained prevalence-adjusted average
prediction accuracies expressed as area under the receiver characteristic operating
curve (AUC, see Box 1) of about 0.8 for brown and blue eye color, respectively
(where 0.5 means random prediction and 1.0 means completely accurate prediction); most of the eye color predictive value was provided by the HERC2 rs916977
The rst comprehensive DNA prediction study on eye color was published in 2009
by Liu et al. [17], where the authors selected from previous publications 37 SNPs
from 8 pigmenta- tion genes, and investigated their eye color predictive capacity in

a total of >6100 Dutch Europeans. They trained an eye color prediction model
based on 24 SNPs from 8 genes in >3800 samples, and validated the model in
>2300 independent samples (see Box 1). This model provided AUCs of 0.93 for
brown and 0.91 for blue eye color, while for intermediate eye color the AUC was
considerably smaller at 0.73. A single SNP, HERC2 rs12913832 that was emphasized
before to carry substantial eye color information [14], expressed most of the
predictive effect, solely achieving AUC values of 0.899 for brown and 0.877 for blue.
Liu et al. [17] proposed 6 SNPs from 6 pigmentation genes (HERC2 rs12913832,
OCA2 rs1800407, SLC24A4 rs12896399, SLC45A2 rs16891982, TYR rs1393350, and
IRF4 rs12203592) as a minimal set of eye color DNA predictors. This 6-SNP set
achieved AUC values of 0.93 for brown, 0.91 for blue, and 0.72 for intermediate eye
color in the >2300 Dutch Europeans used for model validation [17].
In a parallel study published in 2010, Valenzuela et al. [18] tested 75 SNPs from 24
pigmentation candidate genes for their predictive effect on pigmentation variation
in eye, hair, and skin using >780 Europeans and non-Europeans. Three SNPs from 3
pigmentation genes, HERC2 rs12913832, SLC45A2 rs16891982, and SLC24A5
rs1426654 (the former two overlap with the best six from Liu et al. [17]), provided
an R2 from multiple linear regression modelling (see Box 1) of categorical eye color
of 76.45%; of this, the vast majority (74.8%) was achieved by HERC2 rs12913832
alone [18]. However, mixing Europeans and non- Europeans in the ascertainment of
eye color predictive SNPs poses a challenge in separating ancestry from eye color
effects, so that the achieved prediction outcomes are difcult to interpret. Indeed,
additional data [19,20] suggested that SLC24A5 rs1426654 is unlikely to be directly
involved in eye color (see further explanation below for hair color). In 2010 too,
Mengel- From et al. [21] conrmed in almost 400 Danish Europeans the eye color
predictive value of HERC2 rs12913832, which together with two other HERC2 SNPs
rs1129038 and rs11636232 in strong linkage disequilibrium (LD) with rs12913832 in
Europeans, and OCA2 rs1800407 provided likelihood ratios (see Box 1) from 4-SNP
diplotypes of up to 29.3 for dark and up to 10.7 for light eye color (rs12913832 and
rs1800407 overlap with the best 6 SNPs from Liu et al. [17]).
Based on previous ndings together with the SNP prediction rankings observed by
Liu et al. [17], the rst DNA-based eye color prediction system for forensic usage
was developed by Walsh et al. [22] and published in 2010/2011. This IrisPlex system
includes a sensitive assay for multiplex genotyping of the six most eye color
predicting SNPs from Liu et al. [17] (HERC2 rs12913832, OCA2 rs1800407, SLC24A4
rs12896399, SLC45A2 rs16891982, TYR rs1393350, and IRF4 rs12203592) and
implemented the predic- tion model from Liu et al. [17] into an interactive and easyto-use Excel sheet that provides categorical eye color probabilities from user input
SNP genotypes. The forensic developmental validation of the IrisPlex assay was
published in the same year, demonstrat- ing that the assay is fully compatible with
all SWGDAM guidelines

[23]. The IrisPlex assay is highly sensitive, delivering complete 6- SNP proles down
to about 30 pg input DNA [22,23]. The IrisPlex system was further tested to predict
eye color in 940 worldwide DNA samples from HGDP-CEPH [22]. Although exact eye
color phenotypes were unavailable for these samples, different eye colors were only
predicted in European samples and less so in those from neighboring regions, while
in samples from distant regions such as East Asia, Africa, Oceania and from Native
Americans, only brown eyes were predicted (except a single Native American who
was unpredicted) [22]. Therefore, the distribution of the IrisPlex-predicted eye color
is highly concordant with the known global distribution of eye color categories,
which strongly suggests that IrisPlex performs well, regardless to the bio-geographic
origin of the sample under testing [22].
Although the initially introduced IrisPlex eye color prediction model was based on
thousands of Europeans [17], they were all from one population (Dutch); therefore,
a subsequent validation of the prediction model on >3800 Europeans from seven
countries was performed [24]. The model based on thousands of samples from
across Europe performed nearly identical to the initial model based on thousands of
Dutch Europeans, demon- strating the robustness of the IrisPlex model [24]. The
AUC values achieved in this pan-European study were even higher than established
before [22] with the IrisPlex markers (0.96 for blue and brown, respectively). The
authors attributed the gain in accuracy to the use of more accurate eye color
phenotype data they obtained from high-resolution digital images. In 2014, the
enhanced IrisPlex prediction model for eye color was introduced based on >9100
individuals from eight parts of Europe, which achieved AUCs of 0.95 for brown, 0.94
for blue, and 0.74 for intermediate eye color [25]. When applied to an independent
set of about 120 Polish individuals, not included in model building or validation, the
enhanced IrisPlex model delivered on average eye color prediction accuracies of
84%; or 93% when only brown and blue prediction was assessed and the
intermediate category was not included [25].
Recently, the IrisPlex assay was tested by the European DNA Proling Group
(EDNAP) of the International Society for Forensic Genetics (ISFG) in a multi-center
exercise involving >20 laboratories with various levels of specic experience
(including novices), and was found to be easy to implement and highly reliable [26].
All 6 IrisPlex SNPs were included in a commercial tool, the Identitas V1 Forensic
Chip, allowing to infer biogeographic ancestry, appearance, relatedness, and sex
from genome-wide SNPs, which had been tested in a large number of DNA samples
[27]. This tool ( provides among other forensically relevant
information (including hair color) eye color prediction using the IrisPlex model [27].
However, as with all SNP microarrays, the underlying hybridization technolo- gy
provides challenges to low quantity and/or low quality input DNA [27].
Subsequent to the initial publication of IrisPlex, other SNP sets with partially
overlapping markers have been proposed for eye color prediction. In 2011,

Spichenok et al. [28] introduced a 6-SNP set including HERC2 rs12193832, IRF4
rs12203592, SLC45A2 rs16891982, OCA2 rs1545397, ASIP rs6119471, and MC1R
rs885479, of which the former three overlap with IrisPlex [22]. These SNPs were
ascertained from, and prediction was performed in >550 European and nonEuropean samples. As mentioned before, the across-ethnicity study design for
select- ing predictive SNPs applied to a regional trait such as European eye (and
hair) color variation is, however, unable to differentiate between true eye color
effects and ancestry effects. Most of the previous studies could not show an effect
of MC1R on eye color variation, although this gene is well-known for having a strong
effect on light skin color, freckles, and red hair as seen in Europeans.
Pneuman et al. [29] attempted to directly compare the outcomes of the 6-SNP set
from Spichenok et al. [28] with the 6-SNP IrisPlex set [22]. The authors reported that
the IrisPlex set and prediction approach (error rate 31% plus 26% inconclusive
outcomes) predicted eye color much less accurately than the Spichenok set and
prediction approach (2.8% error rate without inconclusive outcome). Such a large
discrepancy appears unexpected given the overlap in the SNPs used, particularly
the top ranked eye color predictor HERC2 rs12193832 which provides most of the
predictive value, and may be explained by multiple factors. However, it should be
noted that for the predicted outcomes there is a denitional difference between the
two approaches used. The prediction outcomes from IrisPlex are specic in that they
are probabilities for having blue, brown, or intermediate eye color. On the other
hand, the outcomes of the Spichenok prediction approach [28] include non-blue
and non- brown predictions, which are expected at higher accuracies. Such a
non-color prediction approach is conceptually prone to argument, and, in the very
least, makes a direct comparison with a color prediction approach difcult.
Furthermore, IrisPlex eye color prediction [22,23] is based on a statistical model
using underlying phenotypic and genotypic data (see Box 1), while the Spichenok
approach [28] is based on an ad hoc classication procedure not using statistics. Of
the 135 errors reported for IrisPlex by Pneuman et al. [29] 130 (96.3%) were seen
with individuals of intermediate eye color. Notably, however, the IrisPlex test was
introduced for accurate blue and brown eye color prediction, while its value for
predicting intermediate eye colors has always been highlighted as its greatest
limitation [2225]. Recently, the Spichenok 6-SNP set for eye color prediction was
updated to a 5-SNP set by excluding the MC1R and the OCA2 SNPs and including an
additional IrisPlex SNP (SLC24A4 rs12896399) [30], so that both sets now overlap in
4 SNPs.
Allwood and Harbison [31] tested 19 SNPs from 10 pigmenta- tion genes in a small
sample of 101 New Zealanders of European and non-European origin, and proposed
a set of 4 SNPs i.e., SLC24A4 rs12896399, OCA2 rs1800407, TYR rs1393350, and
HERC2 rs1129038 for eye color prediction, of which the former three overlap with
IrisPlex and the latter one is in strong linkage disequilibrium (LD) with HERC2
rs12913832 (R2 > 0.99 in Euro- peans) included in both sets. These 4 SNPs

achieved prediction accuracies of 89% for blue and 94% for brown eye color using a
classication tree model approach (see Box 1).
Ruiz et al. [32] described an eye color prediction test based on 23 SNPs out of 37
that were tested via two multiplex genotyping assays in >410 Europeans, and
obtained eye color phenotypes from SNP genotypes via an Bayesian classier (i.e.,
Snipper) (see Box 1). The authors particularly emphasized that adding HERC2 and
OCA2 SNPs that are in LD (partly in strong LD) with HERC2 and OCA2 SNPs included
in the IrisPlex, leads to increased prediction accuracies, particularly for intermediate
eye color [32]. For a subset of 13 SNPs i.e., the 6 IrisPlex SNPs plus 4 HERC2 SNPs
(rs1129038, rs11636232, rs7183877, and rs1667394), and 3 OCA2 SNPs
(rs4778241, rs4778232, and rs8024968) they reported AUC values of 0.999 for
blue, 0.990 for brown, and 0.816 for intermediate eyes [32]. This is compared to
0.986, 0.978, and 0.756, respectively, obtained by the authors with the 6 IrisPlex
SNPs in the same samples. Previous studies [16,17,21,33] had already noted
benecial predictive values when considering LD SNPs, including those from HERC2
and OCA2, but the observed effects were smaller than those reported by Ruiz et al.
[32]. Possible explanations are the use of more accurate phenotypes and/or
accuracy over-estimations, for instance due to sample size limitations (see Box 1).
Freire-Aradas et al. [34] recently showed that the inclusion of HERC2 rs1129038, as
advocated by Ruiz et al. [32] to improve intermediate (green-hazel) eye color
prediction, revealed higher than expected green-hazel predictions in people from
the Americas, Middle East, and West Asia for which IrisPlex predicted brown eyes as
is expected in such regions (no eye color phenotypes were available in these
samples). As emphasized by Ruiz et al. [32], additional studies are needed to better
understand the additive values of SNPs in LD with each other, such as those from
the HERC2OCA2 region, to the prediction of eye color.
Recently, Yun et al. [35] compared two eye color prediction algorithms, the IrisPlex
model they implemented in FROG-kb ( and Snipper
(http://mathgene. as used by Ruiz et al. [32], in data from the 6
IrisPlex SNPs obtained in >900 samples from 12 Eurasian populations. Out of >700
individuals with complete IrisPlex proles, 22% inconsistent predictions were
observed between both approaches, demonstrating that the differences in the
underlying logic and supporting data of both approaches can yield different
prediction outcomes [35]. Overall, the authors reported fewer blue eye predictions
and more inconclusive results obtained with Snipper versus with the IrisPlex
prediction model, whereas IrisPlex revealed no intermediate eye color predictions
while Snipper did in 29 instances [35]. Due to the lack of eye color phenotypes in
the samples used in this study, it cannot be said, which prediction approach was
more accurate. Both methods, however, performed similarly well in predicting
brown eye color in all individuals from the 4 East Asian populations used [35], one of
the geographic region where only brown eye color is expected to exist.

Lately, non-European populations that have experienced European admixture in

their population history, such as those from the Americas, are starting to be
explored for DNA-based eye color prediction [34,36]. For instance, Dembinski et al.
[36] analysed the 6 IrisPlex SNPs in 200 U.S. Americans; using the initial IrisPlex
model, they obtained high rates of correct predictions for blue eye color (95% using
an 0.7 and 0.5 probability threshold), while for brown eyes less correct predictions
where obtained (76% and 88% with the 0.7 and 0.5 threshold, respectively), and no
correct intermediate predictions were found. The authors reported more
inconclusive results than seen in the initial IrisPlex data, which they explained by
the greater number of intermediate eye color individuals used as a result of the
hypothesized admixture effect in U.S. Americans studied [36]. Notably, most
incorrect and inconclusive eye color predictions were found in individuals that were
heterozygote for HERC2 rs12931382 (which were 30% of the samples they
analysed). Clearly, more data on European- admixed populations are needed to
better understand the relationship between genetic admixture, eye color, and DNAbased eye color prediction accuracy using existing or newly developed SNP sets.
Although some groups e.g., Ref. [32] favor the increase of SNP predictors for eye
color over the 6-SNPs used with IrisPlex, Pietroni et al. [37] recently suggested the
opposite strategy. Referring to the tradition of conservative statistical weight
calculation in the eld of forensic genetics, and given the by far strongest eye color
prediction effect known for HERC2 rs12913832 relative to all other current known
SNP predictors for eye color, the authors suggested to limit DNA-based eye color
prediction solely to HERC2 rs12913832 [37]. Without any statistical help (see Box
1), such ad hoc approach concludes blue eyes when the homozygote GG(CC)
genotype is observed, brown eyes when the homozygote TT(AA) genotype is found,
while all heterozygote individuals remain inconclusive [37]. Although this approach
was already applied earlier in the bone DNA identication of Nicolaus Copernicus
and his HERC2-predicted blue eye color [38], further discussion in the eld will
show, if this rather simplistic view on DNA-based eye color prediction will be
followed more widely.
A different issue with DNA-based eye color prediction that was controversially
discussed recently is whether or not gender provides a considerable inuence on
the prediction accuracies. In 2013, Martinez-Cadenas et al. [39] claimed that gender
is a major factor explaining discrepancies in eye color prediction based on
HERC2/OCA2 genotypes and the IrisPlex model. Initially, their conclusion was based
on blue eye prediction for which considerably lower prediction sensitivity was
observed in males versus females, and intermediate eye color prediction where
females displayed a considerably lower sensitivity than males. However, in the
Spanish sample used, the sample size for blue (N = 55) and intermediate (N = 69)
eye color, for which they observed a gender effect, was markedly lower than for
brown eyes (N = 369), for which no gender effect was noted. In a reply letter, Liu et
al. [40] suggested that these ndings may rather be explained by stochastic effects

due to the small sample size used; their much larger pan-European EUREYE and
Dutch European datasets did not show such effect. However, Martinez-Cardenas et
al. [41], in their reply to Liu et al. [40], presented a second and enlarged dataset (N
= 1170 Spanish melanoma cases and controls) for which they showed a strong and
statistically signicant difference in blue eye color frequency among males (22%)
and females (13%). The authors re-emphasized that in their samples females
tended to present darker eye colors than predicted by IrisPlex in a signicantly
higher proportion than males [41]. In a subsequent study, Pietroni et al. [37] found
gender to be signicantly associated with quantitative eye color measurements in
an Italian population sample, but not in a Danish and a Swedish sample. Notably, a
gender effect on quantitative eye color was observed before by Liu et al. [33], but in
this study it only explained 0.04% of hue and 0.09% of saturation in the Dutch
population studied, while in the Italian population analysed by Pietrone et al. [37],
gender explained 4.9% of the PIR-score that is based on saturation. Pietrone et al.
[37] concluded that the gender effect on eye color may be a population specic
However, there is currently no evidence for the existence of a X-chromosomal gene
contributing to human eye color variation, which if existing could in principle
explain gender differences in eye color, and when used for DNA-based eye color
prediction in prediction accuracies. Moreover, it is completely unclear how the eye
color effect of such a hypothetical X-chromosomal gene if existing would be
population dependent. If population-specicity is indeed involved, this would
consequently mean that the sexual selection, which is assumed to have shaped
human eye color phenotypic and genotypic variation in and across Europe [42]
towards the frequencies we observe today, would have acted differently on men
and women in different parts of Europe, for which there currently is no evidence.
Clearly, more and reasonably large datasets from different parts of Europe are
needed to further explore this issue and its relevance for practical FDP. Liu et al.
[40] showed in two large datasets that taking gender into account in the IrisPlex
prediction modeling did not improve eye color prediction accuracy to any noticeable
degree. If however, future work will indeed demonstrate that including gender
information in DNA-based eye color prediction signicantly improves the prediction
accuracy, the will typically not oppose a problem to practical forensic work. Typically
FDP such as eye color DNA prediction is performed after conven- tional DNA
proling (without obtaining a match), which includes the AMELY/AMELX system for
sex determination, so that DNA-derived gender information would be available (or
could be established from additional DNA typing) for consider- ation in the modelbased eye color prediction, if indeed proven to be benecial.
An area in human pigmentation (or other appearance) genetics that has started to
be explored, but needs further attention, are epistasis effects and how they
contribute to pigmentation (or other appearance) phenotypes and their DNA-based
prediction. Such interaction between SNPs from the same and/or different

pigmentation genes has been found already, particularly for eye color
[32,33,43,44]. Recently, Pospiech et al. [45] in a systematic study using >1000
Polish Europeans, identied new and previously noted SNPSNP interactions
contributing to pigmentation traits. Some of these interactions increased eye color
prediction accuracies, albeit not to a large degree. For instance, considering
interaction between HERC2 rs12913832 and OCA2 rs1800407 as well as between
TYRP1 rs1408799 raised the AUC for green eyes from 0.667 to 0.697 [45].
Future research activities shall particularly concentrate on solving the limitation of
all currently available eye color DNA test systems in being least accurate to predict
non-blue, non-brown eye colors. The nature of non-blue, non-brown eyes
representing the continuum between the two extremes of blue and brown eyes
makes it expectable that DNA prediction of the intermediate eye color category is
more difcult than for blue and brown, which all currently available DNA tests show.
More studies need to be performed to nd out if additional, previously unrecognized
DNA variants exist that particularly contribute to these intermediate colors. Or
instead, if these intermediate eye colors can be explained by increasing numbers of
genetic loci with small individual effects also seen for blue and brown. In the future,
it would also be benecial to expand DNA prediction of eye color, as available on
the categorical level with the current tools, to continuous eye color. A quantitative
approach to eye color DNA prediction would increase the level of detail eye color
information can be achieved. Such an approach, which would nally hand-out to
investigators a specic color chart, is expected to minimize nal interpretation
problems that may exist with current categorical verbal outcomes provided to the
investigators. For example, different investigators may have different shades of
color in mind (e.g., blue, light blue, light gray) when searching for an unknown
suspect after being told by forensic DNA experts that the suspect has blue eyes with
a probability of 95%. Although to date accurate DNA prediction of continuous eye
(as well as hair and skin) color is far from reality, because the necessary DNA
markers are not yet available, achieving this goal may eventually be possible as
indicated by the rst studies that identied DNA predictors of quantitative eye color.
Liu et al. [33] exemplied that a GWAS on continuous eye color obtained from highresolution digital eye images in thousands of Europeans allows the identication of
additional genes and predictive SNPs that remained elusive in previous gene search
studies using categorical eye color phenotypes. Some other studies too have been
conducted to investigate quantitative eye color [37,46].
Forensik fenotipe DNA: penampilan manusia Memprediksi dari bahan TKP untuk
tujuan investigasi

Forensik DNA fenotip mengacu pada prediksi ciri penampilan donor sampel yang
tidak diketahui, atau tidak diketahui almarhum (hilang) orang, langsung dari bahan
biologis yang ditemukan di lokasi kejadian. "Saksi Biologi" hasil fenotipe DNA

Forensik dapat memberikan arahan investigasi untuk melacak orang yang tidak
dikenal, yang tak dikenal mampu dengan saat DNA perbandingan pro ling.
Aplikasi kecerdasan ini dari DNA menandai penggunaan forensik substansial
berbeda dari materi genetik daripada yang dari DNA saat ini pro ling disajikan
dalam ruang sidang. Saat ini, c ciri pigmentasi kelompok-spesik sudah diprediksi
dari DNA dengan akurasi yang cukup tinggi, sementara beberapa karakteristik
eksternal lainnya terlihat berada di bawah penyelidikan genetik. Sampai individuspesik penampilan menjadi akurat diprediksi dari DNA, DNA konvensional pro
ling perlu dilakukan setelah prediksi DNA penampilan. Terutama, dan di mana
Forensik DNA fenotip menunjukkan janji besar, ini adalah pada kelompok (banyak)
lebih kecil dari tersangka potensial, yang sesuai dengan karakteristik penampilan
DNA-diprediksi dari noda TKP atau dari sisa-sisa orang yang sudah meninggal. Suf
dana sien tersedia yang dibuat tersedia, penelitian di masa depan untuk lebih
memahami dasar genetik dari penampilan manusia diharapkan akan mengarah
pada penjelasan substansial lebih rinci tentang penampilan orang tak dikenal itu
dari DNA, memberikan peningkatan nilai untuk penyelidikan polisi di pidana dan
hilang kasus orang yang melibatkan tidak diketahui.

1. Forensik fenotipe DNA: beberapa pertimbangan umum

Analisis forensik DNA, yaitu, identikasi orang melalui ulangi tandem pendek (STR)
pro le pencocokan bahan bukti tidak diketahui dengan bahan referensi dari orang
yang dikenal, telah dianggap sebagai standar emas dalam ilmu forensik [1]. Namun,
salah satu keterbatasan utama dari pendekatan komparatif ini DNA identikasi, juga
berlaku untuk STR dan polimorsme nukleotida tunggal (SNP), adalah bahwa hal itu
biasanya gagal untuk mengidentikasi orang-orang yang STR atau SNP pro le
belum diketahui para peneliti. Orang mungkin tidak tersedia untuk perbandingan
DNA pro le yang cocok karena mereka telah berhasil lolos penyelidikan polisi dan
dengan demikian dihindari menjadi tersangka diketahui. Meskipun pendekatan saat
ini menjadi lebih efektif whenforensic DNA (pro le) database berada di tempat [2],
kasus-kasus dimana bukti DNA pro le tidak cocok dengan setiap orang yang
dikenal termasuk semua yang tersimpan dalam DNA forensik (pro le) basis data
secara rutin dilihat oleh peneliti . Dengan tidak adanya informasi lain yang
menyediakan lead untuk menelusuri diketahui donor sampel forensik, kasus dingin
bisa menunggu untuk berbagai periode waktu (kadang-kadang untuk waktu yang
lama), sebelum bukti STR pro le cocok dengan orang yang dikenal kemudian
ditambahkan ke tumbuh forensik Database DNA atau disampaikan sebagai
tersangka oleh polisi ulang penyelidikan kasus yang diberikan.

Pemutaran massa DNA dapat dilakukan dalam kasus-kasus di mana tidak ada DNA
pro le pertandingan diperoleh dan tidak ada bukti lain yang tersedia [3]. Dalam
pukat DNA tersebut, sejumlah besar orang (ratusan hingga ribuan), biasanya
mereka yang tinggal di wilayah geogras di mana kejahatan terjadi, diundang untuk
secara sukarela memberikan sampel air liur untuk sebuah STR pro ling. Meskipun
pelaku benar tidak dapat berpartisipasi secara sukarela, karena kesadaran sampel
yang disediakan mengarah ke identikasi, non-partisipasi dapat meningkatkan
kecurigaan dan dengan demikian mengarahkan peneliti menuju lead tambahan. Jika
pelaku benar tidak berpartisipasi tetapi hanya kerabat dekat lakukan, pencarian
keluarga mampu mengidentikasi mereka, yang menyediakan tive penyelidikan
mengarah ke mendapati pelaku yang tidak diketahui. Menggunakan autosomal
konvensional STR pro ling di jaring DNA membatasi kemungkinan pencarian
keluarga untuk menutup kerabat yang tidak diketahui, non-berpartisipasi pelaku,
yang dapat diatasi dengan menggunakan STR Y-kromosom bukan (jika DNA bukti
berasal dari pelaku laki-laki) [ 4]. Karena Y-STR pro le mengidentikasikan seorang
pria bersama-sama dengan semua kerabat laki-laki dari pihak ayah, orang-orang
dekat dan jauh, sebuah jaring Y-STR adalah lebih efektif daripada pukat berdasarkan
STR autosomal (atau SNPs). Misalnya, besar Y-STR jaring yang melibatkan ribuan
orang relawan lokal akhirnya menyebabkan memecahkan kasus pembunuhan di
Belanda setelah 13 tahun penelitian [5]. Namun, agar berpotensi sukses, dekat
dan / atau kerabat jauh dari pelaku yang sebenarnya (jika tidak pelaku sendiri)
harus berpartisipasi dalam tes DNA massa. Kehadiran lokal kerabat mungkin lebih
cenderung di daerah pedesaan, di mana kerabat cenderung bermigrasi, daripada di
daerah perkotaan. Secara umum, bagaimanapun, pukat DNA tersebut tanpa spesik
penyebab dan bukti untuk meminta relawan sering terlihat kritis karena masalah
etika, dan di beberapa negara dilarang secara hukum. Selain itu, beban ekonomi
untuk memperoleh STR pro les dari ratusan atau bahkan ribuan individu dalam
satu kasus yang tinggi. Karena alasan ini, pukat DNA tidak diterapkan sering [3-5].

Keterbatasan ini DNA perbandingan pro ling mendorong perkembangan yang

relatif baru dalam genetika forensik, yaitu, Forensik DNA fenotip (FDP) [6,7]. FDP
bertujuan untuk menyimpulkan noda tidak diketahui atau sampel donor
karakteristik eksternal terlihat (EVCs) dari DNA (atau biomarker molekul lainnya)
langsung dari bahan biologis ditinggalkan di TKP, atau diperoleh dari badan yang
tidak diketahui. Pada intinya, hasil FDP dapat berfungsi sebagai "saksi biologi", dan
berpotensi dapat memberikan informasi yang lebih akurat daripada saksi mata
manusia lakukan, yang diketahui dapat diandalkan [8]. Dengan demikian, FDP
diharapkan dapat memberikan arahan investigasi memungkinkan untuk melacak
pelaku yang tidak diketahui, yang tidak diidentikasi mampu melalui konvensional
DNA perbandingan pro ling. FDP juga diharapkan dapat bermanfaat untuk orang
hilang identikasi tion ca-, yaitu, dalam kasus di mana referensi DNA pro le dari
putatif sampel ante-mortem, atau dari kerabat yang diduga tidak tersedia.

Kesimpulan DNA dari bio-geogras keturunan (lihat Philipps dalam masalah ini)
kadang-kadang dianggap sebagai bagian dari FDP [7]; Namun, keturunan genetik
tidak selalu menggambarkan karakteristik eksternal terlihat, terutama pada individu
dari keturunan genetik campuran.

Penampilan prediksi dari DNA untuk penggunaan forensik dimulai pada awal 2000an dan pertama berkembang sangat lambat. Alasan utama untuk pengenalan relatif
terlambat dari prediksi penampilan forensik dari DNA adalah (masih) pengetahuan
yang terbatas tentang genetika paling EVCs manusia. Meskipun dibutuhkan
peralatan teknologi yang sama dan metode statistik untuk mengidentikasi gen
penyakit untuk nd gen EVC, pengetahuan kita tentang penyakit warisan saat ini
lebih maju [9] dari pada bagaimana kita melihat. Salah satu alasan untuk
pengetahuan genetik penampilan terbatas sampai hari ini mungkin berkaitan
dengan penelitian strategi pendanaan yang biasanya lebih fokus pada variasi
terkait penyakit dari pada variasi manusia normal dan eksplorasi genetik. Dari
semua EVCs, yang melibatkan pigmentasi yaitu, variasi dalam warna iris manusia,
rambut kepala, dan (kurang begitu) kulit, adalah yang terbaik dan saat ini satusatunya contoh FDP praktis (lihat di bawah). Meskipun semua EVCs dianggap sifat
yang kompleks, di mana beberapa banyak gen berkontribusi terhadap fenotip
bersama-sama dengan faktor lingkungan, sifat pigmentasi manusia pada umumnya
tampak sedikit genetik kompleks dari semua EVCs, dengan beberapa beberapa gen
menyediakan sebagian besar informasi fenotipik, setidaknya pada tingkat kategori
yang luas. Oleh karena itu, pemahaman dasar genetik dari sifat pigmentasi saat ini
lebih maju daripada yang lain EVC, dan dengan demikian prediksi pigmentasi
berbasis DNA. Semua EVCs lain, berdasarkan kondisi saat ini atau harapan yang
dikembangkan dari pengetahuan saat ini, genetik jauh lebih kompleks dengan
puluhan hingga diharapkan ribuan gen berkontribusi, yang mempersulit identikasi
gen yang bertanggung jawab dan penanda DNA prediktif.

Masalah dengan sifat-sifat genetik yang sangat kompleks, karena menyadari untuk
banyak penyakit yang umum, adalah bahwa setiap gen individu memberikan
kontribusi hanya sebagian kecil dari varians fenotipik, dan hanya kombinasi dari
sejumlah besar faktor genetik dapat menjelaskan komponen diwariskan secara
keseluruhan [10] . Selain itu, semakin besar komponen lingkungan, kurang dapat
dijelaskan dengan DNA, dan - tentu saja - setiap kontribusi non-genetik tidak pernah
dapat dijelaskan oleh tes DNA. Menurut pengetahuan anekdot, dan berdasarkan
temuan sebelumnya dari kembar studi ity heritabil- [11], EVCs manusia biasanya
membawa komponen genetik yang besar, namun dampak lingkungan juga ada,
untuk beberapa EVCs lebih daripada yang lain. Namun jika gen hanya memiliki efek
individu kecil pada sifat fenotipik, itu sulit untuk menjadi diidentikasi dengan
toolbox saat ini digunakan oleh ogists epidemiol- genetik, karena sinyal statistik

terukur adalah teliti kecil. Oleh karena itu memerlukan penggunaan set besar
individu untuk mengidentikasi efek genetik kecil seperti dengan tingkat yang
diperlukan dari statistik signikansi. Sejak alat yang genomik digunakan untuk
nding gen, seperti microarray SNP, masih mahal (yaitu, kira-kira. 250 EUR per
sampel individu, dan exome atau seluruh genom sekuensing adalah dengan
besaran lebih mahal), melakukan kajian asosiasi genome-wide (Kaca ) pada
sejumlah besar individu (yaitu, puluhan ribu) dengan sejumlah besar single
nucleotide polymorphisms (SNPs) (yaitu, ratusan ribu dan lebih) dengan cepat
menjadi terjangkau bagi rata-rata laboratorium tunggal. Pembentukan konsorsium
internasional besar, telah menunjukkan untuk menjadi sangat sukses di nding gen
sifat kompleks, penyakit kompleks sebagian besar umum, dengan menggabungkan
angka mengesankan besar sampel (hingga ratusan ribu) [9]. Akibatnya, mengingat
sifat genetik kompleks EVCs, upaya kolaboratif hanya besar akan memungkinkan
penyingkapan secara genetik mereka sebagai prasyarat untuk mengembangkan
penanda DNA prediktif dan alat untuk FDP praktis.

2. fenotipe DNA dari sifat pigmentasi: yang pertama FDP kisah sukses

Dalam tiga berikut sub-bab I merangkum pengetahuan saat ini pada prediksi
berbasis DNA dari mata, rambut, dan warna kulit, masing-masing. Karena kendala
ruang, dan karena itu adalah nilai prediksi dari SNP yang relevan untuk tujuan FDP,
aku kebanyakan meninggalkan hubungan dan keterkaitan studi tentang sifat-sifat
manusia pigmentasi. Tabel 1 daftar semua SNP sebelumnya diterapkan untuk mata
dan / atau rambut dan / atau prediksi warna kulit dari DNA.

2.1. Warna mata

Yang pertama dua studi yang dilakukan iris prediksi (mata) warna berbasis DNA
diterbitkan pada tahun 2007. Frudakis dkk. [12] digunakan 33 SNPs dari gen OCA2,
yang memungkinkan mereka untuk mengklasikasikan 8% dari warna mata diamati
antara> 1000 sampel. Sulem dkk.

[13], tertanam dalam pertama GWAS pada sifat pigmentasi manusia, digunakan 9
SNP dari 6 daerah genomik (SLC24A4, KITLG, 6p25.3, TYR, OCA2-HERC2, dan MC1R)
yang mereka diidentikasi dengan kan asosiasi warna mata signikan antara
beberapa ribu Eropa, untuk prediksi warna mata kategoris. Dari individu-individu
DNA-diprediksi dengan <0,2 probabilitas untuk coklat dan <0,1 probabilitas untuk

hijau, sekitar 90% memang bermata biru, dan dari individu DNA diprediksi akan
coklat dengan> 0,5 probabilitas, sekitar 60% memang cokelat bermata. Pada tahun
2008, tiga studi paralel [14-16] melaporkan gen HERC2 sebagai gen warna mata
yang paling penting. Sturm dkk. [14] dan Eiberg dkk. [15] disorot HERC2
rs12913832 sebagai prediktor warna mata besar, sementara Kayser et al. [16],
karena isi SNP dari mikroarray digunakan dalam GWAS mereka, menyoroti beberapa
SNP HERC2 lain seperti rs916977. Sturm dkk. [14] melaporkan nilai R2 (lihat Kotak
1) dari 0,68 untuk HERC2 rs12913832 saja. Eiberg dkk. [15] mencatat tertentu h-1
haplotipe berdasarkan 13 SNPs dari daerah OCA2-HERC2, termasuk HERC2
rs12913832, tetapi juga orang lain seperti HERC2 rs916977, hadir di 97% dari
orang-orang yang dianalisis dengan mata biru. Kayser et al. [16], yang dikhususkanout gen HERC2 melalui GWAS, selain itu dilakukan prediksi resmi berbasis DNA dari
warna mata menggunakan 3 SNP (rs916977 HERC2, rs11855019 OCA2, dan
rs7495174 OCA2). Penulis memperoleh rata akurasi prediksi prevalensi disesuaikan
dinyatakan sebagai daerah di bawah kurva penerima operasi karakteristik (AUC,
lihat Kotak 1) dari sekitar 0,8 untuk warna mata coklat dan biru, masing-masing (di
mana 0,5 berarti prediksi acak dan 1,0 berarti benar-benar akurat tion prediksi );
sebagian besar nilai prediktif warna mata diberikan oleh rs916977 HERC2 saja.

Yang pertama DNA komprehensif studi prediksi pada warna mata diterbitkan pada
tahun 2009 oleh Liu et al. [17], di mana penulis yang dipilih dari publikasi
sebelumnya 37 SNP dari 8 gen tion pigmenta-, dan diselidiki kapasitas prediksi
warna mata mereka dalam total> 6100 Belanda Eropa. Mereka dilatih model
prediksi warna mata berdasarkan 24 SNP dari 8 gen dalam> 3800 sampel, dan
divalidasi model di> 2300 sampel independen (lihat Kotak 1). Model ini tersedia
AUCs dari 0,93 untuk coklat dan 0,91 untuk warna mata biru, sedangkan untuk
warna mata menengah AUC adalah jauh lebih kecil di 0,73. Sebuah single SNP,
HERC2 rs12913832 yang ditekankan sebelumnya untuk membawa informasi warna
mata yang besar [14], menyatakan sebagian besar efek prediktif, hanya mencapai
nilai AUC 0,899 untuk coklat dan 0,877 untuk biru. Liu et al. [17] mengusulkan 6
SNP dari 6 gen pigmentasi (HERC2 rs12913832, rs1800407 OCA2, SLC24A4
rs12896399, SLC45A2 rs16891982, TYR rs1393350, dan IRF4 rs12203592) sebagai
seperangkat minimal prediktor DNA warna mata. Set 6-SNP ini mencapai nilai AUC
0,93 untuk coklat, 0,91 untuk biru, dan 0,72 untuk warna mata menengah dalam>
2300 Belanda Eropa yang digunakan untuk model validasi [17].

Dalam sebuah penelitian paralel diterbitkan pada tahun 2010, Valenzuela et al. [18]
diuji 75 SNP dari 24 pigmentasi kandidat gen untuk efek prediksi mereka pada
variasi pigmentasi di mata, rambut, dan kulit menggunakan> 780 Eropa dan nonEropa. Tiga SNP dari gen 3 pigmentasi, HERC2 rs12913832, SLC45A2 rs16891982,
dan rs1426654 SLC24A5 (mantan dua tumpang tindih dengan yang terbaik enam

dari Liu et al. [17]), memberikan R2 dari model regresi linier berganda (lihat Kotak
1) dari kategoris warna mata dari 76,45%; ini, sebagian besar (74,8%) dicapai oleh
HERC2 rs12913832 saja [18]. Namun, pencampuran Eropa dan non-Eropa dalam
pemastian warna mata prediktif SNP merupakan tantangan dalam memisahkan
keturunan dari efek warna mata, sehingga hasil prediksi dicapai adalah sulit untuk
menafsirkan. Memang, data tambahan [19,20] menyarankan bahwa rs1426654
SLC24A5 tidak mungkin terlibat langsung dalam warna mata (lihat penjelasan lebih
lanjut di bawah ini untuk warna rambut). Pada tahun 2010 juga, Mengel- Dari dkk.
[21] con rmed di hampir 400 Denmark Eropa nilai prediktif warna mata HERC2
rs12913832, yang bersama-sama dengan dua rs1129038 HERC2 SNP lain dan
rs11636232 di linkage disequilibrium kuat (LD) dengan rs12913832 di Eropa, dan
OCA2 rs1800407 disediakan rasio kemungkinan (lihat Kotak 1 ) dari 4-SNP
diplotypes hingga 29,3 untuk gelap dan sampai 10,7 untuk warna mata cahaya
(rs12913832 dan rs1800407 tumpang tindih dengan yang terbaik 6 SNP dari Liu et
al. [17]).

Berdasarkan temuan sebelumnya bersama-sama dengan peringkat prediksi SNP

diamati oleh Liu et al. [17], sistem prediksi warna mata berbasis DNA pertama
untuk penggunaan forensik dikembangkan oleh Walsh et al. [22] dan diterbitkan di
2010/2011. Sistem IrisPlex ini termasuk alat tes sensitif untuk multipleks genotip
dari enam yang paling warna mata memprediksi SNP dari Liu et al. [17] (HERC2
rs12913832, rs1800407 OCA2, SLC24A4 rs12896399, SLC45A2 rs16891982, TYR
rs1393350, dan IRF4 rs12203592) dan diimplementasikan model tion prediksi dari
Liu et al. [17] ke lembar Excel interaktif dan mudah digunakan yang menyediakan
kategoris probabilitas warna mata dari input pengguna SNP genotipe. Validasi
perkembangan forensik dari uji IrisPlex diterbitkan pada tahun yang sama, yang
didemonstrasikan bahwa uji yang sepenuhnya kompatibel dengan semua pedoman

[23]. The IrisPlex assay sangat sensitif, memberikan lengkap 6- SNP pro les ke
bawah sekitar 30 pg masukan DNA [22,23]. Sistem IrisPlex selanjutnya diuji untuk
memprediksi warna mata di 940 sampel DNA di seluruh dunia dari PKGM-Ceph [22].
Meskipun fenotipe warna mata yang tepat yang tersedia untuk sampel ini, warna
mata yang berbeda hanya diperkirakan dalam sampel Eropa dan kurang begitu
pada mereka dari daerah tetangga, sedangkan dalam sampel dari daerah yang jauh
seperti Asia Timur, Afrika, Oceania dan dari penduduk asli Amerika, hanya coklat
mata diprediksi (kecuali satu penduduk asli Amerika yang tidak dapat diprediksi)
[22]. Oleh karena itu, distribusi warna mata IrisPlex-diprediksi sangat sesuai dengan
distribusi global dikenal kategori warna mata, yang sangat menunjukkan bahwa
IrisPlex berkinerja baik, terlepas ke asal bio-geogras sampel di bawah pengujian

Meskipun mata IrisPlex model prediksi warna awalnya diperkenalkan didasarkan

pada ribuan orang Eropa [17], mereka semua dari satu populasi (Belanda); Oleh
karena itu, validasi berikutnya dari model prediksi pada> 3800 Eropa dari tujuh
negara dilakukan [24]. Model berdasarkan ribuan sampel dari seluruh Eropa
dilakukan hampir identik dengan model awal berdasarkan ribuan Belanda Eropa,
melakukan demonstrasi kekokohan model IrisPlex [24]. Nilai-nilai AUC dicapai dalam
penelitian pan-Eropa ini bahkan lebih tinggi dari yang ditetapkan sebelumnya [22]
dengan spidol IrisPlex (0,96 untuk biru dan coklat, masing-masing). Para penulis
disebabkan keuntungan dalam akurasi untuk penggunaan data fenotip warna mata
yang lebih akurat mereka diperoleh dari resolusi tinggi gambar digital. Pada tahun
2014, model prediksi yang disempurnakan IrisPlex untuk warna mata diperkenalkan
berdasarkan> 9100 individu dari delapan bagian Eropa, yang mencapai AUCs 0,95
untuk coklat, 0,94 untuk biru, dan 0,74 untuk warna mata menengah [25]. Ketika
diterapkan pada set independen dari sekitar 120 individu Polandia, tidak termasuk
dalam model bangunan atau validasi model IrisPlex ditingkatkan disampaikan ratarata warna mata akurasi prediksi 84%; atau 93% ketika hanya coklat dan biru
prediksi dinilai dan kategori menengah tidak termasuk [25].

Baru-baru ini, uji IrisPlex diuji oleh DNA Eropa Pro ling Group (EDNAP) dari
Masyarakat Internasional untuk Genetika Forensik (ISFG) dalam latihan multi-pusat
yang melibatkan> 20 laboratorium dengan berbagai tingkat pengalaman yang
spesik (termasuk pemula), dan ditemukan menjadi mudah untuk menerapkan dan
sangat handal [26].

Semua 6 IrisPlex SNP termasuk dalam alat komersial, Chip Forensik Identitas V1,
memungkinkan untuk menyimpulkan keturunan biogeogra, penampilan,
keterkaitan, dan seks dari genome SNP, yang telah diuji di sejumlah besar sampel
DNA [27]. Alat ini ( memberikan informasi antara forensik
terkait lainnya (termasuk warna rambut) prediksi warna mata menggunakan model
IrisPlex [27]. Namun, seperti dengan semua microarray SNP, yang mendasari
hibridisasi-teknologi gy memberikan tantangan untuk kuantitas rendah dan / atau
rendah masukan kualitas DNA [27].

Setelah publikasi awal IrisPlex, set lainnya SNP dengan spidol sebagian tumpang
tindih telah diusulkan untuk prediksi warna mata. Pada tahun 2011, Spichenok dkk.
[28] memperkenalkan 6-SNP set termasuk HERC2 rs12193832, IRF4 rs12203592,
SLC45A2 rs16891982, OCA2 rs1545397, ASIP rs6119471, dan MC1R rs885479, yang
mantan tiga tumpang tindih dengan IrisPlex [22]. SNP tersebut dipastikan dari, dan

prediksi dilakukan di> 550 sampel Eropa dan non-Eropa. Seperti disebutkan
sebelumnya, rancangan penelitian di-etnis untuk pilih- ing SNP prediktif diterapkan
suatu sifat regional seperti mata Eropa (dan rambut) variasi warna, bagaimanapun,
tidak dapat membedakan antara efek warna eye benar dan efek keturunan.
Sebagian besar penelitian sebelumnya tidak bisa menunjukkan efek dari MC1R pada
variasi warna mata, meskipun gen ini dikenal karena memiliki efek yang kuat pada
warna cahaya kulit, bintik-bintik, dan rambut merah seperti yang terlihat di Eropa.

Pneuman dkk. [29] berusaha untuk langsung membandingkan hasil dari 6-SNP set
dari Spichenok dkk. [28] dengan 6-SNP IrisPlex set [22]. Para penulis melaporkan
bahwa set IrisPlex dan pendekatan prediksi (tingkat kesalahan 31% ditambah 26%
hasil tidak meyakinkan) diprediksi warna mata jauh lebih sedikit akurat daripada set
Spichenok dan pendekatan prediksi (tingkat kesalahan 2,8% tanpa hasil tidak
meyakinkan). Seperti perbedaan besar muncul tak terduga mengingat tumpang
tindih dalam SNP digunakan, terutama atas peringkat mata warna prediktor HERC2
rs12193832 yang menyediakan sebagian besar nilai prediktif, dan dapat dijelaskan
oleh beberapa faktor. Namun, perlu dicatat bahwa untuk hasil prediksi ada nitional
perbedaan de antara dua pendekatan yang digunakan. Hasil prediksi dari IrisPlex
yang spesik dalam bahwa mereka probabilitas untuk memiliki biru, coklat, atau
warna mata menengah. Di sisi lain, hasil dari pendekatan prediksi Spichenok [28]
termasuk "non-biru" dan "non-coklat" prediksi, yang diharapkan pada akurasi yang
lebih tinggi. Seperti "non-warna" pendekatan prediksi secara konseptual rentan
terhadap argumen, dan, dalam setidaknya, membuat perbandingan langsung
dengan pendekatan prediksi warna sulit. Selanjutnya, IrisPlex prediksi warna mata
[22,23] didasarkan pada model statistik menggunakan fenotipik yang mendasari
dan data genotipe (lihat Kotak 1), sedangkan pendekatan Spichenok [28]
didasarkan pada hoc dikelompokkan prosedur kasi iklan tidak menggunakan
statistik. Dari 135 kesalahan dilaporkan untuk IrisPlex oleh Pneuman dkk. [29] 130
(96,3%) terlihat dengan individu dari warna mata menengah. Khususnya,
bagaimanapun, tes IrisPlex diperkenalkan untuk prediksi warna mata akurat biru
dan coklat, sementara nilai untuk memprediksi warna mata menengah selalu
disorot sebagai pembatasan terbesarnya [22-25]. Baru-baru ini, yang Spichenok 6SNP ditetapkan untuk prediksi warna mata telah diupdate ke 5-SNP ditetapkan oleh
tidak termasuk MC1R dan SNP OCA2 dan termasuk tambahan IrisPlex SNP (SLC24A4
rs12896399) [30], sehingga kedua set sekarang tumpang tindih dalam 4 SNP.

Allwood dan Harbison [31] diuji 19 SNP dari 10 gen tion pigmenta- dalam sampel
kecil dari 101 Selandia Baru asal Eropa dan non-Eropa, dan mengusulkan satu set 4
SNP yaitu, SLC24A4 rs12896399, rs1800407 OCA2, TYR rs1393350, dan rs1129038
HERC2 untuk prediksi warna mata, yang mantan tiga tumpang tindih dengan
IrisPlex dan satu terakhir adalah di linkage disequilibrium kuat (LD) dengan HERC2

rs12913832 (R2> 0,99 di Euro peans) termasuk dalam kedua set. Ini 4 SNP
mencapai akurasi prediksi 89% untuk biru dan 94% untuk warna mata coklat
menggunakan kasi model pendekatan pohon klasikasi (lihat Kotak 1).

Ruiz et al. [32] dijelaskan tes prediksi warna mata berdasarkan 23 SNP dari 37 yang
diuji melalui dua tes genotip multipleks di> 410 Eropa, dan memperoleh fenotipe
warna mata dari SNP genotipe melalui Bayesian dikelompokkan er (yaitu, Snipper)
(lihat Kotak 1 ). Para penulis terutama menekankan bahwa menambahkan HERC2
dan OCA2 SNP yang di LD (sebagian di LD kuat) dengan HERC2 dan OCA2 SNP
termasuk dalam IrisPlex, menyebabkan peningkatan akurasi prediksi, terutama
untuk warna mata menengah [32]. Untuk subset dari 13 SNP yaitu, 6 IrisPlex SNP
ditambah 4 HERC2 SNP (rs1129038, rs11636232, rs7183877, dan rs1667394), dan
3 OCA2 SNP (rs4778241, rs4778232, dan rs8024968) mereka melaporkan nilai AUC
0,999 untuk biru, 0,990 untuk coklat, dan 0,816 untuk mata menengah [32]. Hal ini
dibandingkan dengan 0,986, 0,978, dan 0,756, masing-masing, diperoleh penulis
dengan 6 IrisPlex SNP dalam sampel yang sama. Penelitian sebelumnya
[16,17,21,33] sudah mencatat manfaat nilai prediktif resmi ketika
mempertimbangkan SNP LD, termasuk dari HERC2 dan OCA2, tetapi efek yang
diamati lebih kecil daripada yang dilaporkan oleh Ruiz et al. [32]. Penjelasan yang
mungkin adalah penggunaan fenotipe dan / atau akurasi over-estimasi, misalnya
karena keterbatasan ukuran sampel yang lebih akurat (lihat Kotak 1). Freire-Aradas
dkk. [34] baru-baru ini menunjukkan bahwa masuknya HERC2 rs1129038, seperti
yang dianjurkan oleh Ruiz et al. [32] untuk meningkatkan menengah (hijau-cokelat)
prediksi warna mata, mengungkapkan lebih tinggi dari yang diharapkan prediksi
hijau-cokelat pada orang dari Amerika, Timur Tengah, dan Asia Barat yang IrisPlex
diprediksi mata cokelat seperti yang diharapkan di daerah tersebut (tidak ada mata
fenotipe warna yang tersedia dalam sampel ini). Seperti yang ditekankan oleh Ruiz
et al. [32], penelitian tambahan diperlukan untuk lebih memahami nilai aditif dari
SNP di LD satu sama lain, seperti dari wilayah HERC2-OCA2, untuk prediksi warna

Baru-baru ini, Yun et al. // mathgene: [35] dibandingkan dua

algoritma prediksi warna mata, model IrisPlex mereka diimplementasikan dalam
FROG-kb ( dan Snipper (http. ) seperti yang
digunakan oleh Ruiz et al. [32], dalam data dari 6 IrisPlex SNP diperoleh di> 900
sampel dari 12 populasi Eurasia. Dari> 700 individu dengan lengkap IrisPlex pro
les, 22% prediksi konsisten yang diamati antara kedua pendekatan, menunjukkan
bahwa perbedaan dalam logika yang mendasari dan data pendukung dari kedua
pendekatan dapat memberikan hasil prediksi yang berbeda [35]. Secara
keseluruhan, para penulis melaporkan prediksi mata biru yang lebih sedikit dan
hasil yang lebih meyakinkan diperoleh dengan Snipper dibandingkan dengan model

prediksi IrisPlex, sedangkan IrisPlex mengungkapkan tidak ada prediksi warna mata
menengah sementara Snipper lakukan di 29 kasus [35]. Karena kurangnya fenotipe
warna mata dalam sampel yang digunakan dalam penelitian ini, tidak dapat
dikatakan, yang pendekatan prediksi lebih akurat. Kedua metode, bagaimanapun,
dilakukan sama dengan baik dalam memprediksi warna mata coklat di semua
individu dari 4 populasi Asia Timur yang digunakan [35], salah satu wilayah
geogras di mana hanya warna mata coklat diharapkan ada.

Akhir-akhir ini, populasi non-Eropa yang mengalami campuran Eropa dalam sejarah
populasi mereka, seperti dari Amerika, mulai dieksplorasi untuk prediksi warna
mata berbasis DNA [34,36]. Misalnya, Dembinski dkk. [36] menganalisis 6 IrisPlex
SNP di 200 US Amerika; menggunakan model awal IrisPlex, mereka memperoleh
tingkat tinggi prediksi yang benar untuk warna mata biru (95% menggunakan
ambang batas probabilitas 0,7 dan 0,5), sedangkan untuk mata cokelat prediksi
kurang benar di mana diperoleh (76% dan 88% dengan 0,7 dan 0,5 ambang ,
masing-masing), dan tidak ada prediksi menengah yang benar ditemukan. Para
penulis melaporkan hasil yang lebih meyakinkan daripada yang terlihat di data
IrisPlex awal, yang mereka menjelaskan dengan jumlah yang lebih besar dari antara
mata individu warna yang digunakan sebagai akibat dari efek campuran hipotesis di
US Amerika belajar [36]. Khususnya, prediksi warna mata yang paling benar dan
tidak meyakinkan ditemukan pada individu yang heterozigot untuk HERC2
rs12931382 (yang 30% dari sampel yang mereka dianalisis). Jelas, lebih banyak
data tentang populasi dicampur Eropa-yang diperlukan untuk lebih memahami
hubungan antara campuran genetik, warna mata, dan berdasarkan DNA akurasi
prediksi warna mata menggunakan set SNP yang ada atau yang baru

Meskipun beberapa kelompok misalnya, Ref. [32] mendukung peningkatan SNP

prediktor untuk warna mata selama 6-SNP digunakan dengan IrisPlex, Pietroni dkk.
[37] baru-baru ini menyarankan strategi yang berlawanan. Mengacu pada tradisi
"konservatif statistik perhitungan berat" di bidang genetika forensik, dan diberi efek
prediksi warna mata jauh terkuat dikenal HERC2 rs12913832 relatif terhadap semua
dikenal prediktor SNP lainnya saat warna mata, penulis menyarankan untuk
membatasi DNA prediksi warna mata berbasis semata-mata untuk HERC2
rs12913832 [37]. Tanpa bantuan statistik (lihat Kotak 1), pendekatan ad hoc seperti
menyimpulkan mata biru ketika homozigot GG (CC) genotipe yang diamati, mata
cokelat ketika homozigot TT (AA) genotipe ditemukan, sementara semua individu
heterozigot tetap tidak meyakinkan [37] . Meskipun pendekatan ini sudah
diterapkan sebelumnya di DNA tulang identikasi dari Nicolaus Copernicus dan nya
HERC2-prediksi warna mata biru [38], pembahasan lebih lanjut di lapangan akan

menunjukkan, jika pandangan agak sederhana ini pada prediksi warna mata
berbasis DNA akan diikuti lebih luas.

Sebuah isu yang berbeda dengan prediksi warna mata berbasis DNA yang
kontroversial dibahas baru adalah apakah atau tidak jender menyediakan cukup
pengaruh pada akurasi prediksi. Pada 2013, Martinez-Cadenas dkk. [39]
menyatakan bahwa gender adalah faktor utama yang menjelaskan perbedaan
dalam prediksi warna mata berdasarkan HERC2 / genotipe OCA2 dan model IrisPlex.
Awalnya, kesimpulan mereka didasarkan pada prediksi biru mata yang sensitivitas
prediksi jauh lebih rendah diamati pada laki-laki dibandingkan perempuan, dan
prediksi warna mata menengah di mana perempuan ditampilkan sensitivitas jauh
lebih rendah daripada laki-laki. Namun, dalam sampel Spanyol digunakan, ukuran
sampel untuk biru (N = 55) dan menengah (N = 69) warna mata, yang mereka
mengamati efek jenis kelamin, adalah jelas lebih rendah daripada untuk mata
cokelat (N = 369), untuk yang tidak berpengaruh gender dicatat. Dalam surat
balasan, Liu et al. [40] menyarankan bahwa temuan ini mungkin agak dijelaskan
oleh efek stokastik karena ukuran sampel yang kecil yang digunakan; jauh lebih
besar EUREYE pan-Eropa dan Belanda dataset Eropa mereka tidak menunjukkan
efek seperti. Namun, Martinez-Cardenas et al. [41], dalam jawaban mereka untuk
Liu et al. [40], disajikan dataset kedua dan membesar (N = 1.170 kasus melanoma
Spanyol dan kontrol) yang mereka menunjukkan kan perbedaan yang kuat dan
secara statistik signikan dengan warna biru frekuensi warna mata antara laki-laki
(22%) dan perempuan (13%). Para penulis kembali menekankan bahwa dalam
sampel mereka perempuan cenderung untuk menyajikan warna mata gelap dari
yang diperkirakan oleh IrisPlex dalam proporsi yang kan signikan lebih tinggi
daripada laki-laki [41]. Dalam sebuah studi berikutnya, Pietroni dkk. [37] ditemukan
jender menjadi secara signikan terkait dengan pengukuran warna mata kuantitatif
dalam sampel populasi Italia, tapi tidak dalam Denmark dan sampel Swedia.
Khususnya, efek jenis kelamin pada warna mata kuantitatif diamati sebelumnya
oleh Liu et al. [33], tetapi dalam penelitian ini hanya menjelaskan 0,04% dari rona
dan 0,09% dari kejenuhan dalam penduduk Belanda dipelajari, sedangkan pada
populasi Italia dianalisis dengan Pietrone dkk. [37], jenis kelamin menjelaskan 4,9%
dari PIR-nilai yang didasarkan pada kejenuhan. Pietrone dkk. [37] menyimpulkan
bahwa efek gender warna mata mungkin populasi spesik fenomena.
Namun, saat ini belum ada bukti keberadaan gen-X kromosom berkontribusi
terhadap variasi warna mata manusia, yang - jika ada - bisa pada prinsipnya
menjelaskan perbedaan gender dalam warna mata, dan - bila digunakan untuk
prediksi warna mata berbasis DNA - di akurasi prediksi. Selain itu, itu benar-benar
jelas bagaimana efek warna mata dari gen X-kromosom seperti hipotetis - jika ada akan tergantung populasi. Jika populasi-spesik kota memang terlibat, ini akibatnya
akan berarti bahwa seleksi seksual, yang diasumsikan telah membentuk manusia
fenotip warna mata dan variasi genotip dalam dan di seluruh Eropa [42] terhadap

frekuensi yang kita amati saat ini, akan bertindak berbeda pada laki-laki dan
perempuan di berbagai belahan Eropa, yang ada saat ini tidak ada bukti. Jelas, lebih
dan cukup besar dataset dari berbagai belahan Eropa yang diperlukan untuk lebih
mengeksplorasi masalah ini dan relevansinya bagi FDP praktis. Liu et al. [40]
menunjukkan dalam dua dataset besar yang mengambil gender dalam pemodelan
prediksi IrisPlex tidak meningkatkan akurasi prediksi warna mata ke tingkat yang
nyata. Jika demikian, pekerjaan di masa depan memang akan menunjukkan bahwa
informasi jender termasuk dalam berbasis DNA prediksi warna mata secara
signikan meningkatkan akurasi prediksi, kehendak biasanya tidak menentang
masalah untuk pekerjaan forensik praktis. Biasanya FDP seperti prediksi DNA warna
mata dilakukan setelah nasional DNA konvensional pro ling (tanpa memperoleh
pertandingan), yang meliputi sistem Amely / AMELX untuk penentuan jenis kelamin,
sehingga informasi jender DNA yang diturunkan akan tersedia (atau bisa dibentuk
dari mengetik tambahan DNA) untuk asi cukup besar dalam prediksi warna mata
model berbasis, jika memang terbukti manfaat resmi.

Suatu daerah di pigmentasi manusia (atau penampilan lainnya) genetika yang mulai
dieksplorasi, tetapi membutuhkan perhatian lebih lanjut, efek epistasis dan
bagaimana mereka berkontribusi untuk pigmentasi (atau penampilan lainnya)
fenotipe dan prediksi mereka DNA berbasis. Interaksi tersebut antara SNP dari gen
pigmentasi yang sama dan / atau berbeda telah ditemukan sudah, terutama untuk
warna mata [32,33,43,44]. Baru-baru ini, Pospiech dkk. [45] dalam studi sistematis
menggunakan> 1000 Polandia Eropa, identikasi ed baru dan sebelumnya
mencatat SNP-SNP interaksi berkontribusi terhadap sifat pigmentasi. Beberapa
interaksi ini meningkat akurasi prediksi warna mata, meskipun tidak untuk tingkat
besar. Misalnya, mengingat interaksi antara HERC2 rs12913832 dan OCA2
rs1800407 serta antara rs1408799 TYRP1 mengangkat AUC untuk mata hijau 0,6670,697 [45].

Kegiatan penelitian di masa depan akan sangat berkonsentrasi pada pemecahan

keterbatasan semua sistem tes DNA warna mata saat ini tersedia dalam menjadi
paling tidak akurat untuk memprediksi non-biru, warna mata non-coklat. Sifat nonbiru, mata non-cokelat mewakili kontinum antara dua ekstrem mata biru dan coklat
membuatnya diharapkan juga bahwa prediksi DNA dari kategori warna mata
menengah lebih sulit daripada biru dan coklat, yang semua tes DNA saat ini
tersedia menunjukkan. Studi lebih perlu dilakukan untuk nd jika tambahan, varian
DNA yang sebelumnya tidak dikenal ada yang sangat berkontribusi terhadap warnawarna menengah. Atau sebaliknya, jika warna-warna eye menengah dapat
dijelaskan dengan meningkatnya jumlah lokus genetik dengan efek individu kecil
juga terlihat untuk biru dan coklat. Di masa depan, itu juga akan menjadi manfaat
resmi untuk memperluas prediksi DNA dari warna mata, seperti yang tersedia di

tingkat kategoris dengan alat saat ini, untuk warna mata terus menerus.
Pendekatan kuantitatif untuk prediksi DNA warna mata akan meningkatkan tingkat
informasi warna mata rinci dapat dicapai. Pendekatan seperti itu, yang akan
akhirnya tangan-ke penyidik bagan warna yang spesik, diharapkan untuk
meminimalkan nal masalah interpretasi yang mungkin ada dengan hasil lisan
kategoris saat diberikan kepada para peneliti. Sebagai contoh, peneliti yang
berbeda mungkin memiliki nuansa yang berbeda warna dalam pikiran (misalnya,
biru, biru muda, abu-abu terang) ketika mencari seorang tersangka diketahui
setelah diberitahu oleh para ahli DNA forensik bahwa tersangka memiliki mata biru
dengan probabilitas 95%. Meskipun prediksi tanggal akurat DNA mata terus
menerus (serta rambut dan kulit) warna jauh dari kenyataan, karena penanda DNA
yang diperlukan belum tersedia, mencapai tujuan ini akhirnya dapat dibuat seperti
yang ditunjukkan oleh studi pertama yang mengidentikasikan prediktor DNA ed
warna mata kuantitatif. Liu et al. [33] dicontohkan bahwa GWAS pada warna mata
terus menerus diperoleh dari gambar resolusi tinggi mata digital dalam ribuan
Eropa memungkinkan identikasi gen tambahan dan SNP prediksi yang tetap sulit
dipahami dalam studi pencarian gen sebelumnya menggunakan fenotip warna mata
kategoris. Beberapa penelitian lain juga telah dilakukan untuk menyelidiki warna
mata kuantitatif [37,46].