The University of Helsinki canceled their search for a new professor when I started to ask questions

South Harbor, Helsinki

About three years ago, I was contacted by a couple of my Finnish criminology colleagues encouraging me to apply for a tenure track professorship at the University of Helsinki’s Institute of Criminology and Legal Policy (KRIMO). At the time, I was reaching the end of my fixed-term postdoctoral appointment at the Karolinska Institute in Stockholm, so this seemed like a great opportunity. I ended up applying for the position along with 10 other candidates. The search committee chose me as one of the top three finalists whose dossiers were sent out for external reviews. In the end, following the assessments by external reviewers, one round of interviews, and a teaching demonstration, the position was offered to a more senior candidate. Although I was personally disappointed with the outcome, the process had been fair.

In December of last year (2020), I was made aware that KRIMO had advertised a similar tenure track professorship position, this time focusing on “Crime and Public Policy”. I was initially quite perplexed when reading the description of the position. It appeared as if they were looking for the Leonardo DaVinci of 2021: a scholar of legal studies who had expertise in “social and health policies” and, importantly, “the ability to utilize KRIMO’s access to unique administrative register data generated by the authorities”. Whilst it is odd for a position to require this breadth of competencies across such wide-ranging fields and methodological approaches, I remained enthusiastic about my chances.

First, I had previously been shortlisted for a similar position. Second, I have graduate level training in sociology, a PhD in psychiatric epidemiology and I have authored numerous peer-reviewed papers in high-impact international journals focusing on understanding violent criminality and related behaviors in the Nordic countries. Serving as a Senior Research Fellow at the Social and Public Policy Unit at the University of Helsinki for the past two years, I have been able to work with the Finnish nationwide registry data, which have resulted in one accepted paper and a few others currently under review. In addition, I have recently started working on a project where we intend on assessing the validity of various violence risk assessment tools in Finnish prisons and forensic services.

Despite these credentials, my Finnish criminology colleagues were not as encouraging this time around. Turns out there was a back story to the convoluted job description. Apparently, it was a compromise between two factions within KRIMO. On the one hand, there is as a group of criminal policy researchers focusing on legal analyses of crime, and, on the other hand, a smaller group of empirical social science criminologists who use quantitative methods to understand the causes and consequences of crime and punishment. The rumors had suggested that prominent members of the KRIMO leadership were looking for an intellectual successor to its current director, Professor Tapio Lappi-Seppälä, a leading figure in Finnish criminal policy, who is expected to retire soon after decades of service. Although the idea was not to hire a new director, there seemed to be a sense that it was important for the legal scholars to preserve the legacy of Professor Lappi-Seppälä. Much of his work is dedicated to advocating for the prevailing criminal justice system, which is internationally recognized as one of the least punitive in the world.  

I therefore applied for the position with an understanding that the process may be somewhat different from my first experience a couple of years earlier. However, little did I know that things were about to go pretty weird. In the end, the search was canceled after twists and turns that raise some tough questions about the integrity of the hiring process at the flagship university of Finland. In what follows, I will provide the timeline of the events as they unfolded.

31 January, 2021

This was the deadline for the advertised position.

1 February, 2021

I requested to get a list of the applicants from the human resources specialist working on the search, Ms. Minna Maunula, as this is a matter of public record. I received the list on the same day. There were 25 applicants in total, which was more than double that of the pool of applicants for the previous position. I have decided not to publish the names of the candidates in the interest of maintaining their integrity. Those interested in the list can request to obtain it by e-mailing Ms. Maunula.

11 February 2021

I received an e-mail notification about the establishment of the internal search committee:

Dear Applicant,

Thank you for your interest in the position of tenure track or full professor in crime and public policy at the University of Helsinki. The applications amounted to 25.

The dean of the Faculty of Social Sciences, Professor Marjaana Seppänen, will establish an appointment committee soon. The committee consists of five members whom we are currently selecting. This might still take a while. However, I will let you know as soon as the committee is appointed. The first task of the committee is to shortlist the applicants.

Minna Maunula
HR Specialist

23 February, 2021

The composition of the search committee was announced:

Dear Applicant,

For your information, the dean of the Faculty of Social Sciences, Professor Marjaana Seppänen, has established an appointment committee consisting of the following five members: Professor Petri Ylikoski (chair, University of Helsinki), Docent Noora Ellonen (University of Tampere), Professor Ilse Julkunen (University of Helsinki), Professor Anne Kouvonen (University of Helsinki) and Professor Sakari Melander (University of Helsinki). The committee will hold a meeting to prepare a shortlist on the 8th of March. I will inform each applicant of the decision on Tuesday, 9 March, at the latest.

Best wishes,

9 March, 2021

It was around this time that the search process started to take strange turns. I received a notification that the search committee could not reach an agreement on which candidates to shortlist. Once I received this e-mail, I contacted some senior colleagues working at the university and they told me that this turn of events was extremely rare. No reason was given for the lack of agreement between the members of the search committee. Here is the full message sent to the applicants:

Dear Applicant,

The appointment committee hold a meeting yesterday but unfortunately could not reach a decision about the shortlist yet. I will send you further information next week.

Best wishes,

15 March, 2021

For reasons that remain unknown to me, the search committee made a recommendation to extend the deadline of the search until April 13, which was approved by the Dean of the Faculty of Social Sciences, Professor Marjaana Seppänen. The job description remained unchanged and there were no indications that the search committee had made any efforts to either widen the search or make any other changes in the recruitment strategy. They simply extended the deadline by one month. 

Dear Applicant,

The dean has made a decision in accordance with the unanimous proposal of the appointment committee to extend the application period for a professorship of crime and public policy until 13 April. Current applicants will be taken into account without a further notice.

Best wishes,

1 April, 2021

A full two weeks later, the HR specialist of the search committee informed the original applicants that we could update our materials in time for the second deadline. The irony of the date in which this was done was not lost on us.

Dear Applicant,

Should you want to update the contents of your application to a position of professorship in crime and public policy, please send me an updated pdf-document by the 13th of April.

Please remember to compile all attachments in one pdf document. I would appreciate if you could insert the word “updated” to the name of the latest version of your application.

If there is nothing to be updated in your application, it will be assessed as it is at the present.

Best wishes,

13 April, 2021

The new deadline for the applications. The following day, I once again made a request to retrieve the updated list of applicants.

16 April, 2021

I received the updated list along with another e-mail from the HR specialist informing us that an additional 9 applicants had applied for the position. By this time, there were a total of 33 applicants for the position as one of the applicants had withdrawn. As a result of the new applicant pool, one member of the search committee (Dr. Noora Ellonen) became ineligible due to a conflict of interest and had to be replaced.

Dear Applicant,

This is just to inform you that we received nine new applications by the end of the prolonged application period. As one applicant withdrew her application, the total number of the applications amounted to 33.

Unfortunately, the submission of the new applications led to the disqualification of one of the members of the appointment committee. Therefore, we have to find someone to replace her.

This may take a while, but I’ll notify you of the new composition of the committee and the schedule of process at my earliest convenience.

I wish you have a nice weekend.

Best wishes,

23 April, 2021

By this date, more red flags started to emerge. We received an e-mail informing us that Dr. Noora Ellonen, the only expert in the search committee on quantitative criminology using the nationwide Finnish registries, was going to be replaced by Professor Kimmo Nuotio, a legal scholar in Helsinki. The search committee consisted now of scholars in philosophy, law (x 2), social work, and social epidemiology.

Dear Applicant,

This is just to inform you that the new composition of the appointment committee is the following: Professor Petri Ylikoski (chair), Professor Anne Kouvonen, Professor Ilse Julkunen, Professor Sakari Melander, and Professor Kimmo Nuotio. The committee will hold a meeting on Monday, 26 April.

Best wishes,

The Director of KRIMO, Professor Tapio Lappi-Seppälä is a long-time collaborator of two of the search committee members now, namely Professors Sakari Melander and Kimmo Nuotio. All three of them have coauthored several publications examining Finnish criminal policy and its legal implications. This was, however, not the only red flag.

Professor Lappi-Seppälä was the PhD supervisor of Miikka Vuorela, who earned his PhD in historical criminology on 19 February 2021. Dr. Vuorela was not eligible to apply for this position at the time of the first deadline (31 January) but he did apply for the position in the second round with the deadline of 13 April. Given what I had heard about the internal conflicts in KRIMO, I found it odd that a person who was widely considered to be a protégé of Professor Lappi-Seppälä suddenly reaped the benefits of this unprecedented maneuver by the search committee. I decided to take a closer look at Dr. Vuorela’s PhD dissertation, and I found that he had acknowledged the newly appointed member of the search committee, Professor Kimmo Nuotio, as his intellectual mentor (PDF; page 6):

According to Google Translate, this passage translates to: “I would also like to thank Professor Kimmo Nuotio. Our joint journey has been quite short so far, but I have always been impressed the fire with which you have defended and promoted the democratic rule of law and humane criminal justice in domestic and international cooperation.”

I also found that the Professor Nuotio had even acted as a preliminary examiner (“custos”) of Dr. Vuorela’s dissertation, which is clearly a conflict of interest. [Since publishing this post, I have been informed that the custos in the Finnish context refers to a faculty-appointed chair of the public examination.]

24 April, 2021

As the steering committee was about to select the candidates for the shortlist and the external assessors, I alerted the committee, the Dean of the Faculty of Social Sciences as well as the Chancellor of the University of Helsinki, about my concerns of the integrity of this search process by sending the e-mail below.

Whilst searching for their contact information, I also noted that one of the search committee members and a long-time collaborator of Professor Lappi-Seppälä, Professor Sakari Melander, is currently serving as the legal secretary to the Chancellor of the University. Finnish academia is certainly a small world. 

6 May, 2021

The rector of the University made the decision to cancel the application process. One can only speculate as to the extent to which this decision resulted from my letter questioning the process. The reasoning behind this decision was expressed by the chair of the search committee, Professor Petri Ylikoski, in the proposal letter below. The committee argued that no one, out of 33 candidates (!), was qualified to even be appointed Assistant Professor of Crime and Public Policy in Finland. Interestingly, the search committee did not provide assessments of the specific candidates.

I wish to draw attention to this part of the letter: “The appointment committee considers it important to safeguard research and teaching in Crime and Public Policy” (emphasis added). Given what I know about the circumstances of this search, this sentence comes across as an implicit admission that the search was canceled because there was a risk that the external evaluators – assuming they were independent of the “network of 4” – might recommend the appointment of someone whose research agenda could challenge the status quo. Was it deemed important to the protect the field from outsiders?    

Concluding remarks

Why did I decide to share this series of events in my blog? My intention is not to suggest that I was the best candidate for the position. In fact, there were several mainstream criminal justice scholars in the pool that could have been chosen over me. My purpose here is to expose a series of questionable decisions that have contributed to making the process appear tainted. Again, without revealing any names, I know that at least two leading researchers of Finnish criminal policy, both of whom are currently senior scholars, applied for this position. I would like to see a justification for why they were not considered good enough to be shortlisted for the position. To suggest that none of the applicants were even worthy of being considered for an Assistant Professorship position is, in my view, patently absurd – and many of my Finnish colleagues agree.

I received a response to my e-mail from Ms. Maunula later the same day. She wrote:

Dear Dr. Amir Sariaslan,

Thank you for your email.

In accordance with established academic practice, the Faculty of Social Sciences does not engage the retiring professor in the selection of his/her successor. Therefore, Professor Lappi-Seppälä has not been involved in any way in discussing the related duties, preparing the call for applications or selecting the members of the appointment committee.

You have most probably received my message explaining that the rector has decided to discontinue the application process on the basis of the unanimous proposal of the appointment committee supported by the dean.

Minna Maunula
HR Specialist

Two of the closest colleagues of Professor Lappi-Seppälä served on the search committee for a position of his successor yet Ms. Maunula contends that Professor Lappi-Seppälä was not involved in any capacity throughout the process. The natural question that arises here is to what extent the university made sure that this has indeed been the case. Have they, for instance, checked phone or e-mail records documenting the communications between the “network of 4”? I assume that this has not been done. Let me be clear; I am not suggesting they should have done anything of the sort. The best way to reduce the conflicts of interest in the hiring process is to avoid involving individuals professionally and personally connected to the applicants. As noted, one member of the search committee stepped down because she had published one article with one new applicant. How should we regard a situation where the search committee features two (2) close collaborators of the dissertation chair of an applicant for a position currently occupied by the dissertation chair? The fact that this was allowed to happen with no internal resistance reflects very poorly on the university. 

One can only speculate as to what will happen next. One possibility is that KRIMO decides to use the invitational route to choose a term-limited candidate for the position. That approach would allow them to avoid Swedish applicants who ask too many questions, and to safeguard the prevailing agenda. However, I remain confident that such things would not happen in one of the least corrupt countries in the world.

What have twin studies taught us about educational attainment?

The development in the field of the behavior genetics of educational outcomes has been nothing less than astonishing in the recent decade. Numerous twin studies have demonstrated that roughly half of the individual differences in academic achievement could be attributed to genetic factors. The same studies have also shown important contributions of both family-wide and individual-specific environmental factors. Molecular genetic investigations have thus far identified over a thousand genetic variants that are associated with educational attainment. Researchers are now using these discoveries to predict a wide range of different outcomes in external datasets.

In a series of blog posts, I intend on summarizing some of the important studies in the field. Given the nature of blog posts, this will not be a systematic review of the literature but my aim is to make it as representative as possible.

Why twin models?

The rationale for the classical twin model is the estimate the relative contributions of genetic and environmental influences to a trait of interest. The classical twin model is based on the assumptions that identical twins share all of their co-segregating genes whilst fraternal twins share half of their co-segregating genes. The model further assumes that the early environmental influences are roughly equal across both types of twins. There are a number of additional assumptions as well but the validity of the model remains strong (1, 2). Given these model assumptions, the presence of genetic influences is determined by the extent to which the correlation of a given trait is higher in identical twins as compared to fraternal twins. 

By measuring a trait of interest in a sufficiently large group of identical and fraternal twins, researchers are able to examine to what extent the individual differences in the trait could be attributed to three sources of influences; (A) additive genetic influences or the heritability, (C) shared environmental influences, and (E) unique environmental influences. Shared environmental influences encompass an aggregate of all non-genetic factors within the family that make the twins more similar to one another in regards to the trait of interest. These could include factors like parenting practices and socioeconomic status. Unique environmental influences is a somewhat misleading term as it includes all factors that make the twins different from one another. These include individual-specific environmental risk factors but also measurement error and random (stochastic) events. 

The evidence from the UK
The Twins Early Development Study (TEDS) is a representative study of approximately 16,000 twin pairs in the United Kingdom. In a study of academic achievement measured at the age of 16 years (GCSE exam scores), the TEDS researchers found that an excess of 50% of the individual differences between the twins could be attributed to genetic factors (3). Furthermore, the researchers found that environmental factors shared within the family explained between a fifth to a quarter of the individual differences whilst the rest of the variation was attributed to unique environmental influences. In other words, both nature and nurture explained why the students differed in their achievements. 

In a follow-up study (4), the TEDS team were interested in examining the relative contributions of genetic and environmental influences on intelligence and specific school subjects:

Similar to the previous study, the researchers found that an excess of half of the individual differences across all of the examined outcomes could be attributed to genetic differences in the population. Among the school subjects, shared environmental influences explained a larger proportion of the individual differences than did unique environmental influences. In contrast, they found that shared environmental influences explained a very small proportion of the variation in intelligence.

The second aim of this study was to examine how intelligence and the specific school subjects were related to one another by adopting multivariate twin models. This approach enabled the researchers to study how genetic and environmental influences explained the associations between the outcomes. To put this in more simpler terms, one could say that if the association between two outcomes was stronger among identical twins as compared to fraternal twins then it implied that genetic factors explained a proportion of the observed association in the sample. 

The researchers found, rather expectedly, strong associations between the measures of achievement in the specific subjects and intelligence. In other words, this meant that students who achieved well in a particular subject were on average more likely than their peers to achieve well in other subjects. Interestingly, the researchers also found that the genetic influences overlapped to a large extent between the outcomes. Expressed more technically, the observed genetic correlations between each combination of the specific school subjects and intelligence varied between 44% and 88%. These findings support the existence of both generalist genes that explain differences across all of the examined outcomes and specialist genes that only explain differences in the specific outcomes. The shared environmental correlations were even stronger, ranging between 66% and 95%. This implies that shared environmental factors might be influencing academic performance more generally across all of the subjects rather than being subject-specific. In contrast, the unique environmental correlations were rather low, ranging between 9% to 35%, which could either suggest that the individual-level risk factors were subject-specific or that the estimates were attenuated by a combination of measurement error and random noise.

What’s included in the high heritability of academic achievement?
To many readers, it may seem somewhat strange that the heritability estimates of the academic achievement measures are so large. One of the many advantages of the TEDS study is its comprehensive data collection measuring the participant’s abilities, personality, problem behaviors and living conditions. This allowed the researchers to study how such factors overlapped genetically with school performance, as measured by an index of the GCSE core subjects (5):

The heritability of school performance was estimated to 62% and genetic factors that explained individual differences in intelligence accounted for about half of it. Together, all of the measures explained roughly three quarters of the heritability. 

The stability of school performance
The TEDS team have also examined the stability of school performance and its relative determinants among the twins from primary school up to secondary school (6). The study found that the contributions of genetic and environmental influences were relatively stable across time and subject: 

Similar findings in the Netherlands
Dutch behaviour geneticists have extensively studied measures of educational attainment for a number of decades and their findings have been similar to their British colleagues. In a 2015 study of 12 414 twin pairs, for instance, they observed that the heritability estimates for different indicators of educational attainment measured during primary school varied between 44% and 73% (7):

Even academic choices are heritable
A fascinating line of research has demonstrated that heritable factors do not only contribute to individual differences in academic performance but also to our choices to pursue higher education and the subjects that we wish to specialize in. Importantly, these studies have also shown why twin studies are important to get gain greater insights into how environmental factors also explain such differences.

In a 2016 paper of 6584 twin pairs (8), the TEDS researchers examined how genetic and environmental factors influenced the choice to pursue university preparatory courses (“A-levels”). They additionally examined the subject-specific courses that the students elected.

The results indicated that heritable factors explained an excess of 40 percent of the individual differences across all of the outcomes. The researchers nevertheless observed that whilst shared environmental factors explained roughly the same amount of variation in the choice to pursue any of the A-level courses, their contributions to the subject-specific courses were substantially lower. One interpretation of these findings could be that family members encourage the students to pursue higher education but that they may be less concerned with the specific subjects that the students choose.

You’re on your own once you’ve reached the university
In one of their most recent studies, the TEDS team examined university outcomes among 3000 of the twin pairs (9). Similar to the previous study, they found that genetic and shared environmental influences contributed roughly equally to the choice of enrolling at university. Again, this is consistent with family members encouraging the students to pursue higher education. Interestingly, the authors failed to find that such factors influenced how the students performed in their university courses. The latter was instead explained by genetic (46%) and unique environmental (54%) influences.

Highest achieved education
A 2013 meta-analysis estimated the heritability of educational attainment as defined by the highest achieved educational level to be approximately 40% (10), which is somewhat smaller in magnitude to those presented above. This illustrates the importance of outcome definitions. A crude measure of highest achieved educational level will rank individuals with very heterogenous abilities equally. For instance, two individuals with master’s degrees in astrophysics and history, respectively, will, on average, have very different abilities. The best outcome definition will therefore depend on what the specific research question of interest is.

Where are the genes?
In my next blog post, I will cover the recent advances in the molecular genetics of educational attainment, from genome-wide association studies to studies that adopt genetic risk scores to predict a wide range of outcomes. Please subscribe to the blog to stay updated.

Är det bra att håna och trakassera sina barn? En lektion i vilseledande forskning och journalistik

De senaste dagarna har jag varit väldigt frustrerad över nyhetsrapporteringen kring en ny studie som har publicerats i den vetenskapliga tidskriften Journal of Youth and Adolescence. Forskarna tror sig ha visat att föräldrarnas kränkande behandling av sina barn stör barnens känsloreglering, vilket i sin tur förklarar varför dessa har ökade risker att bli utsatta för mobbning och att utsätta andra för liknande handlingar. För många tycks fynd av det här slaget vara helt oproblematiska men historien har lärt oss en annan läxa.

Kylskåpsmödrarnas återkomst
Under 1950- och 1960-talen populariserades föreställningen om att autism skulle orsakas av emotionellt kyliga mödrar, eller s.k. “kylskåpsmödrar”. Redan 1949 publicerade psykiatern Leo Kanner en artikel i American Journal of Orthopsychiatry som baserades på hans kliniska observationer av ett femtiotal barn med autism och deras föräldrar. Det bör noteras här att det var primärt mödrarna som tog med sina barn till kliniken på den tiden medan fäderna arbetade utanför hemmet. I artikeln noterar Kanner att mödrarna som tog med sig sina barn till kliniken uppenbart visade på emotionell kylighet (s. 422):

Barnens drag och färdigheter såg Kanner istället som ett uttryck för att dessa sökte bekräftelse hos sina föräldrar (s. 425):

Mot bakgrund av den moderna autismforskningen framstår dessa typer av analyser som oerhört ytliga. Vi vet numera att autism är ett starkt ärftligt tillstånd som huvudsakligen orsakas av olika typer av genvarianter (för detaljer, läs Mark Daly:s populärvetenskapliga översikt). Det faktum att mödrarna också uppvisar autistiska drag och har svårt att anknyta till sina barn är därför inte märkligt då dessa har i genomsnitt högre nivåer av autistiska drag jämfört med mödrar utan barn med autism. Problemet ligger således inte i mödrarnas förhållningssätt i sig utan de faktorer som orsakar förhållningssätten. Detta kan förklara varför stödinsatser av typen “föräldraträning” som enbart adresserar förhållningssätten inte tenderar att vara särskilt fruktbara i dessa sammanhang. Det krävs istället andra, mer omfattande och komplexa, insatser.

Den aktuella studien
Forskarlaget rapporterar att de har undersökt 1409 högstadieungdomar i en “mellanstor stad i Sverige”. Studien är longitudinell, vilket innebär att forskarna har följt upp samma ungdomar över tid. I det här fallet har deltagarna undersökts vid tre mättillfällen, från årskurs 7 till årskurs 9. Bortfallet beskrivs vara marginellt och man har inte funnit att de som inte valde att delta skiljde sig ifrån deltagarna på ett antal faktorer som de har undersökt.

Ungdomarna fick själva skatta hur pass ofta de blev exponerade för hånfulla och nedsättande kommentarer av sina föräldrar, hur pass svårt de hade att reglera sina negativa känslor samt hur pass ofta de utsattes för mobbning och/eller utsatte andra för mobbning. Forskarna tillämpade därefter något som kallas för strukturella ekvationsmodeller för att undersöka sambanden mellan dessa tre faktorer över tid:

Fördelen med strukturella ekvationsmodeller är att man kan skatta flera statistiska samband mellan olika variabler samtidigt, där pilhuvuden i illustrationen ovan indikerar riktningen i sambanden. Det faktum att man undersöker flera hypoteser samtidigt gör dock inte den statistiska modellen mer eller mindre kausal, vilket många forskare trodde när dessa lanserades för ett antal decennier sedan. Det är nog lätt att hamna i den fällan när man ser diagram av den ovanstående typen.

När man läser resultatavsnittet för studien slås man av att de observerade sambanden är tämligen små och knappt statistiskt signifikanta. Det vore därför fördelaktigt om vi snabbt friskade upp våra minnen kring hypotesprövningar.

I de flesta vetenskapliga studier har forskare samlat information bland ett urval av deltagare och man vill då veta huruvida de observerade sambanden som man har identifierat går att generalisera till en större population. Ponera att vi har fått fram data om kroppslängd bland två grupper av deltagare, exempelvis våldsbrottslingar och icke-dömda. Vi finner att våldsbrottslingarna är i genomsnitt fem centimeter kortare än de icke-dömda.

Sambandsanalysen ger oss därtill ett s.k. “p-värde”. Detta värde säger oss vad sannolikheten är för att vi ska observera en minst lika avvikande skillnad mellan grupperna, givet att det inte skulle finnas någon skillnad mellan grupperna i populationen. P-värden som understiger 0,05 (eller 5%) brukar i regel betraktas vara statistiskt signifikanta men vad innebär det mer konkret?

Om vi i det här fiktiva exemplet skulle ha fått p-värde på 0,03 skulle vi tolka det som att sannolikheten för att vi ska observera en genomsnittlig skillnad i kroppslängd om minst fem centimeter mellan våldsbrottslingar och icke-dömda i vårt urval trots att det inte skulle finnas någon skillnad i populationen uppgår till enbart 3%. Vi är därför beredda att acceptera att ha fel i högst 5% av fallen.

Multipla tester och p-värden
Efter en vecka har våra kollegor samlat in mer data bland deltagarna. Vi får in ytterligare 9 variabler att analysera, vilka inkluderar alltifrån födelsevikt till intelligenskvot, inkomst och personlighetsdrag. Problemet med att genomföra ett stort antal tester är att det ökar risken för att minst ett av testerna ska bli statistiskt signifikanta trots att trots att det inte skulle finnas ett sådant samband i populationen. För att motverka detta har statistiker utvecklat olika metoder för att korrigera för antalet tester som man genomför. Ett populärt angreppssätt kallas för Bonferroni-metoden, vilket innebär att man dividerar gränsvärdet för signifikans (0,05) med antalet tester som man har genomfört.

Om vi genomför samtliga 10 tester (gruppskillnader i kroppslängd och ytterligare 9 variabler) kommer det nya gränsvärde för statistisk signifikans att vara 0,005 (0,05/10). Vi accepterar därför att enbart att ha fel i 0,5% av fallen eftersom vi har ökat antalet tester som vi vill genomföra. Detta innebär därför att det tidigare resultatet för kroppslängd (p=0,03) inte längre är statistiskt signifikant då p-värdet överstiger 0,005.

Multipla tester i den aktuella studien
Forskarlaget bakom den aktuella studien har genomfört ett stort antal tester som de inte har korrigerat för. Hur pass många tester som de har genomfört framgår inte ens av artikeln. De har exempelvis justerat den primära statistiska modellen för ett flertal mätbara störfaktorer. De har därtill testat för könsskillnader där detaljerna för testerna lyser med sin frånvaro:

Supplemental models included the addition of control variables known to correlate with derisive parenting (i.e., warmth, behavioral control, solicitation of information, knowledge, excessive control, physically punitive parenting, and disclosure), adolescent anger dysregulation (i.e., defiance, callous-unemotional traits, and impulsivity and irresponsibility), and peer difficulties (i.e., peer acceptance, substance use). Each control variable was separately added to the model as a grade 7 predictor to determine if the same pattern of statistically significant indirect effects were maintained. Sex differences were tested with multiple group models.

De har även undersökt alternativa mekanismer:

Follow-up analyses explored alternative patterns of indirect effects (Little 2013). Two models were tested: (a) the mediated path from Grade 7 adolescent anger dysregulation to Grade 9 peer difficulties through Grade 8 derisive parenting, and (b) the mediated path from Grade 7 derisive parenting to Grade 9 adolescent anger dysregulation through Grade 8 peer difficulties. Neither set of indirect effects reached conventional levels of statistical significance.

Det är inte ovanligt att forskare genomför kompletterande analyser av det här slaget men i det här fallet har man varken kontrollerat för antalet tester som har genomförts och än mer häpnadsväckande så redogör man inte för analyserna i bilagor. Det är därför väldigt vanskligt att värdera resultaten.

Mot bakgrund av detta blir det därför märkligt att se att deras p-värden tenderar att vara nära “det konventionella” gränsvärdet för statistisk signifikans (p=0,05). Notera att detta inte är tillämpbart i det aktuella fallet pga multipla tester. Ett axplock av dessa p-värden:

Dåligt kontrollerad
Om vi bortser ifrån det ovanstående för en stund och ser till studiens forskningsdesign kan vi klart konstatera att den är ytterst bristfällig. Den har varken tagit hänsyn till socioekonomiska faktorer eller till ärftliga faktorer. Det är inte slumpmässigt vilka föräldrar som har en förhöjd benägenhet att håna och trakassera sina barn. Emotionell reglering är inte heller något som uppstår av en slump hos barnen. Det går delvis i arv. Det är genom en rigorös kontroll av ärftliga faktorer som forskare kan isolera effekterna av miljöfaktorer för att se vilka av dessa som har en kausal effekt på barnens utfall. I det aktuella fallet har forskarna visat, om man nu ens kan anta att sambanden är statistiskt signifikanta, att barn till hånfulla föräldrar rapporterar högre grad av negativa utfall.

Den okritiska rapporteringen i massmedia
Om man tolkar sambanden som kausala skulle det innebära att insatser som får föräldrar att bli mindre hånfulla skulle ha en direkt effekt på barnens utfall. Det är precis det som forskningsledaren Håkan Stattin gör när TT ringer upp:

Till Sveriges Radio gör han följande uttalande:

Ett flertal andra medier tolkar fynden som kausala. Här SVT:

Jag har inte kunnat se att en enda journalist har ställt en kritisk fråga till forskarlaget. Det är ytterst anmärkningsvärt och nyhetsrapporteringen har varit enligt min mening fullkomligt vilseledande.

Är det då bra att håna sina barn?
Självfallet inte. Allt annat lika är det bättre att inte håna sina barn än att göra det. Samtidigt är inte allt annat lika. Vi kan inte vara säkra på att det är hånet i sig som orsakar utfallen eller om det beror på att hånfulla föräldrar har andra egenskaper som förklarar barnens överrisker. Utan en fördjupad förståelse för fenomenet (läs: orsakerna) kommer vi inte kunna utveckla effektiva insatser för att minska på barnens lidande. Givet de otaliga begränsningar som jag har listat ovan har jag svårt att se hur den här studien kan bidra till mer effektiva insatser. Precis som forskningen kring kylskåpsmödrarna.

Kan hjärnscanning identifiera mördare?

I mitt Twitter-flöde fick jag precis syn på en studie som publicerades häromdagen i den vetenskapliga tidskriften Brain Imaging and Behavior. Forskarlaget hade undersökt skillnader i grå hjärnsubstans bland 203 mördare som jämfördes med 605 andra våldsbrottslingar som inte har begått mord. Forskarna identifierade statistiskt signifikanta skillnader i ett antal hjärnregioner som är associerade med exekutiva funktioner, kontroll av beteenden, emotionell bearbetning och social kognition:

Illustrationer av den ovanstående typen kan ge ett falskt intryck av ett starkt orsakssamband. Därför är det fördelaktigt att hålla huvudet kallt och tänka på att det finns en hel del metodologiska begränsningar med studier av den här typen.

  • Mätningarna har genomförts vid ett tillfälle i vuxen ålder, efter att brotten har begåtts. Forskarna har dels inte kunnat undersöka huruvida utvecklingen av hjärnan över tid påverkade gärningarna, dels kan de heller inte utesluta att gärningarna i sig har orsakat de identifierade skillnaderna.
  • Studiedesignen är icke-experimentell och det är inte slumpmässigt vilka som blir mördare jämfört med de som begår andra typer av brott. Då studien är icke-experimentell har forskarna bara kunnat justera för ett begränsat antal faktorer som utmärker grupperna. Därför kan man inte tolka några eventuella samband som orsakssamband då dessa kan ha påverkats av icke-mätta faktorer.
  • Gruppen “mördare” inkluderade såväl de som hade blivit dömda för mord men även individer som i konfidentiella intervjuer hade medgivit att de antingen hade begått mord eller ett allvarligt mordförsök där utfallet av handlingen hade varit oklart.
  • Våldsbrottslingar med psykossjukdomar eller hjärnskador var exkluderade. Man hade även exkluderat individer som inte kunde skatta den tid som de hade avtjänat i fängelse, vilket forskarna ville justera för i sina statistiska modeller.
  • Generaliserbarheten av fynden kan därtill ifrågasättas då det var en selektion av fångar som valde att delta (mot betalning).
  • Forskarna hade inget replikationsmaterial och således vet man inte om resultaten är avgränsade till det studerade materialet.

Studien är trots dessa begränsningar intressant och bör närmast ses som en liten pusselbit i ett större spel som fortgår. Svaret på frågan som jag ställde i titeln bör nu vara uppenbar.

Spelar familjemiljön ingen roll för barns läsförmågor?

Häromdagen skrev jag ett inlägg om varför vissa barn har bättre läsförmåga än deras kamrater, vilket ledde till en del reaktioner på sociala medier. I inlägget sammanfattade jag två nederländska familje- och tvillingstudier som bl.a. visade att ärftlighetsgraden för läsförmåga var betydande medan delade miljöfaktorer i familjen inte bidrog till att förklara samma utfall.

Av förståeliga skäl var det många som var skeptiska till det senare påståendet. Min duktiga demografkollega Martin Kolk, verksam vid Stockholms universitet och Institutet för framtidsstudier, lämnade denna kommentar på inlägget:

Skulle gärna se en studie där läsande hos (adoptiv) barn var korrelerat med adoptiv och genetiska föräldrars läsande. Skulle vara mycket förvånad om korrelationen var större med genetiska föräldrar. Men det är ju en högst empirisk fråga (jag kan ha fel).

Dock tror jag snarare att det är en attityd till läsande (och massa annat kulturellt) som överförs, och följdaktligen att en ”exogen” ökning av läsande till barn skulle ha en rätt liten effekt.

Det är många som gillar den klassiska adoptionsdesignen eftersom den utgör ett väldigt intuitivt naturligt experiment. Adopterade barn delar i regel genetiken men inte miljön med sina biologiska föräldrar och vice versa med sina adoptivföräldrar. Mot bakgrund av detta tolkas samstämmighet mellan adoptivbarnen och deras biologiska föräldrar som evidens för att genetiska faktorer förklarar individuella skillnader i läsförmåga. På samma vis tolkas samstämmighet mellan samma barn och deras adoptivföräldrar som evidens för att miljöfaktorer i hemmiljön förklarar samma skillnader i läsförmåga.

I likhet med andra forskningsdesigner har adoptionsdesignen sina begränsningar:

  1. Generaliserbarhet. Det är inte slumpmässigt vilka barns om adopteras. De biologiska föräldrarna skiljer sig i regel ifrån andra föräldrar i en rad olika dimensioner, vilket gör det svårare att generalisera fynden till normalbefolkningen.
  2. Besläktade adoptivföräldrar. Det är heller inte slumpmässigt vilka som blir adoptivföräldrar. Historiskt sett har det inte varit ovanligt att mer eller mindre avlägsna släktingar tar över rollen som vårdnadshavare, vilket gör det svårare att bedöma de relativa bidragen av genetik och miljöfaktorer.
  3. Bemedlade adoptivföräldrar. Såväl i Sverige som utomlands är benägenheten att skaffa adoptivbarn högre bland bemedlade personer. Denna selektion gör att variationen i de miljöinfluenser som adoptivbarnen blir exponerade för – som grupp – förblir begränsad jämfört med icke-adopterade barn.
  4. Små urval. De flesta adoptionsstudier tenderar att ha små urval, vilket ökar osäkerheten i resultaten.
  5. Internationella adoptioner. Med svenska registerdata kan man studera adopterade barn. Den nedanstående grafen visar tydligt att den inhemska adoptionen har minskat under de senaste decennierna till förmån för internationella adoptioner. Detta är problematiskt då vi saknar information om de senares biologiska föräldrar.

De adopterade barnen i Colorado och deras läsförmågor
Den första adoptionsstudien för läsförmåga som jag kunde hitta publicerades 2002 i Journal of Child Psychology and Psychiatry. Forskarna hade samlat in data för 245 adoptivfamiljer och lika många kontrollfamiljer i den amerikanska delstaten Colorado. För att kunna göra rimliga jämförelser matchades familjerna på en rad olika faktorer (barnens kön, familjestorleken samt fädernas ålder, utbildningslängd och yrkesprestige). Läsförmågan hos barnen mättes vid tre mättillfällen (7, 12 respektive 16 års ålder). Det visade sig att det inte förelåg några statistiskt signifikanta samband mellan adoptivbarnen och deras adoptivföräldrar, vilket tydligt talar emot någon effekt av hemmiljön. Om något visade resultaten på negativa samband, vilket skulle då innebära att bättre läsförmåga hos adoptivföräldrarna skulle vara förenat med försämrad läsförmåga hos adoptivbarnen. Det gick dock inte att särskilja dessa effekter från ett nollsamband.

Bland de biologiska kontrollfamiljerna fann forskarna däremot att föräldrarna och barnens läsförmågor korrelerade. Skillnaden mellan fynd indikerar att skillnaderna i läsförmågor tycks primärt tillskrivas genetiska faktorer snarare än miljöfaktorer i hemmet.

Resultaten replikerades i Minnesota
I en storskalig familjestudie som publicerades 2011 i Learning and Individual Differences replikerade ett annat forskarlag de ovanstående fynden bland adopterade barn i den amerikanska delstaten Minnesota. Genom att studera tusentals syskon (från enäggstvillingar till icke-besläktade adoptivsyskon) och deras föräldrar kunde forskarna se att ju mer genetik som delades mellan individerna, desto mer samstämmiga var deras läsförmågor. Adoptivmödrarnas läsförmågor korrelerade väldigt svagt med deras adoptivförmågor. Korrelationen var inte signifikant skilt från ett nollsamband. Även om vi ponerar att sambandet hade varit statistiskt signifikant skulle den vara cirka 5 gånger mindre än motsvarande korrelation mellan biologiska mödrar och deras barn. Liknande fynd identifierades för adoptivfäderna och barnen:

När forskarna inkluderade samtliga släktskapstyper (inkl. de adopterade deltagarna) i kvantitativ-genetiska modeller för att skattade de relativa bidragen av genetik och miljöfaktorer kunde de se att ärftlighetsgraderna för de olika utfallen varierade mellan 62% till 72%. Delade familjeinfluenserna var dock inte signifikant skilda från noll.

Forskarlaget var därtill intresserade av att undersöka eventuella gen-miljöinteraktionseffekter. Annorlunda uttryckt ville de veta huruvida ärftlighetsgraden för läsförmågor varierade beroende på föräldrarnas utbildningslängd. De fann inget stöd för det.

Såväl tvillingstudier som adoptionsstudier bekräftar att familjemiljön under uppväxten har en, i bästa fall, ytterst begränsad effekt på individuella skillnader i läsförmågor. Givet att resultaten även fortsättningsvis blir replikerade innebär det att miljöfaktorer som tycks vara av betydelse tenderar att vara antingen individspecifika eller sådana som står bortom familjernas kontroll.