Doug Lemov käis hiljuti EconTalkis oma uuest raamatust rääkimas ja kuigi raamat ise tundub liiga spetsiifiline, et seda põhjalikult lugeda tahaksin, sain sealt ühe väga olulise mõtte, mida allpool tutvustan: päheõppimine pole mõttetu.
Internet tegi entsüklopeediad kasutuks
Mu vanavanematel olid kodus kõik Eesti Entsüklopeedia köited. Praegu oleks see absurdne, sest Wikipedia ja Google’i abil on ükskõik milline entsüklopeediates leiduv infokild kättesaadav sekunditega. Selleks pole vaja isegi arvuti juures ega asustatud kohas olla: Telia 4G võrk katab 97% Eestist.
Enne interneti laiemat levikut oli faktide kontrollimiseks niisiis kaks varianti: vaadata raamatust järgi (logistiliselt keeruline) või jätta suuri infokoguseid meelde (ajamahukas). Füüsilise raamatu entsüklopeediline väärtus on nüüd nullilähedane: sealt ei saa Ctrl+F-ida (jah, see on tegusõna); info kopeerimine on vaevaline; viidete järgimiseks tuleb nupuvajutuse asemel käsitsi lehitseda. On hea ja õige, et selle tehnoloogiaga asendasime. (Paberraamatud pole siiski veel täiesti iganenud: paberile on mugavam märkmeid teha kui e-lugeri või tahvelarvuti ekraanile.)
Kas asjade pähejätmine on sama mõttetu kui entsüklopeedia ostmine? Ei. Tean, et õpilased ja tudengid — ja ma polnud erand — nurisevad, et igaühe taskus oleva telefoni abil on kõik maailma teadmised ainult puudutuse kaugusel. Mõnikord võib neil olla õigus, aga kohe seletan, mis unikaalset väärtust annab päheõppimine.
Päheõppimine…
…vabastab töömälu needusest
Töömäluks1 nimetame süsteemi, mida inimene kasutab ajutiselt info peas hoidmiseks, et seda mingil viisil edasi töödelda. Kasutame seda näiteks keerulisi peastarvutusi tehes, lugedes ja programmeerides (olen kuulnud teooriat, et programmeerija tase sõltub tugevalt sellest, kui palju infot ta töömällu mahub2).
Töömälu on piiratud. Eksperimendid on näidanud, et sinna mahub umbes 4-7 juppi (chunk) sõltuvalt sellest, mis jupi sees on — numbreid mahub rohkem, sõnu vähem. Mida paremini teemat tunneme, seda abstraktsemad on jupid: näiteks keemiaõpinguid alustades võivad jupid olla “aatom”, “H2SO4” ja “reaktsioonivõrrand”; veidi edasijõudnumatel juba “molekul”, “tugev hape” ja “sünteesitee”. Väga konkreetseid näiteid on raske tuua, sest juppidel ei ole tingimata selgeid piire, aga edasijõudnud keemiaõpilase teadmised keemiast on abstraktsemad, üldisemad ja hierarhilisemad.
Peas uute juppide moodustamine on kriitiline osa õppimisprotsessist. See on veidi nagu suure sõjaväeüksuse juhtimine3: kui kindral üritaks strateegiat koostada kümnest tuhandest sõdurist ühekaupa mõeldes, väljuks olukord kiiresti kontrolli alt. Selle asemel struktureeritakse sõdurid hierarhiasse:
- grupp (3-6 inimest)
- jagu (5-15 inimest)
- rühm (15-50 inimest / 3-4 jagu)
- kompanii (50-250 inimest / 2-8 rühma)
- pataljon (3-8 kompaniid)
- rügement (2-5 pataljoni)
- diviis (2-6 rügementi)
- korpus (2-4 diviisi)
- armee (2-5 korpust)
Ülaltoodud hierarhias saab igale tasemele määrata vastutava juhi, kes siis teeb strateegiat vaid käputäie üksustega sõltumata tema taseme üksuste suurusest. Niisuguses lihtsustatud mudelis tuleb kompaniiülemal, kes suudab hästi juhtida paari rühma, õppida karjääriredelil tõusmiseks efektiivselt kasutama paari kompaniid.4
Analoogselt käib õppimine: järgmisele tasemele jõudmiseks tuleb teemat nii hästi mõista, et juba teadaolevat saaks grupeerida ja üldistada ning juppide omavahelisi suhteid analüüsida.
Pähejätmine tähendab selle struktuuri pikaajalisse mällu panemist. Kuigi siin saaks vastu vaielda, et võime ju iga kord struktuuri uuesti internetist või raamatust töömällu laadida, siis see pole eriti võimalik: esiteks võtaks see palju aega ja teiseks ei mahuta töömälu kõike vajalikku. (Kujuta ette, kui insener alustaks iga kord silla disainimist füüsikaõpiku läbilugemisest.)
Kui mingi ala teadmised on su pikaajalises mälus kergesti kättesaadavad, siis on neid töödelda ja loovalt kombineerida palju lihtsam — võrreldes iga 30 sekundi tagant Wikipedia tšekkimisega. Seetõttu annab pähejätmine lisaks intellektuaalse tootmise kiirendamisele ka kvalitatiivse eelise. Pähejätmine avab mõtete ruumis5 seni kättesaamatuid piirkondi.
Sellega on seotud veidi nõrgem argument: pähejätmine aitab mõelda igal pool, mitte ainult arvuti/interneti/raamatute läheduses. Trammiga sõites, tänaval jalutades ja trenni tehes on vaba mõtteressurssi piisavalt, aga kuna loovaimad mõtted saab ehitada ainult tugevale intellektuaalsele karkassile, on kasulik asju peast teada. Hajusat (diffuse) mõtterežiimi saab nii paremini ära kasutada.
…toetab vestlused ühisele alusele
Ühised taustateadmised võimaldavad pidada palju huvitavamaid vestlusi. Kursusekaaslastega, kel on samuti masinõppe taust, saan arutada erialaseid ideid palju sügavamalt kui keskmise omavanusega (samas ei ole minuga keskaegse Euroopa valitsejatest rääkimine eriti produktiivne).6 See kehtib just suulise suhtluse kohta, kus mõtlemiseks-vastamiseks on paar sekundit ja guugeldada ei saa.
(Olen küll kuulnud argumenti, et suur osa intellektuaalsest vestlusest võiks käia hoopis kirjalikus vormis — siis saaks seda jälgida nii kaasaegsed kui tulevased huvilised. Head näited sellest on blogid: psühhiaater Scott Alexander, statistik Andrew Gelman, majandusteadlane Robin Hanson, tarkvaraarendaja/ettevõtja Patrick McKenzie, kvantfüüsik Scott Aaronson jne.)
Muide, faktiteadmiste (“kuidas suri Louis XIV”, “kuidas on defineeritud logistiline regressioon”) meeldejätmine ei ole tingimata olulisim osa vestluses võrdsel tasemel olemiseks. Kõige huvitavamad mõttekäigud koosnevad paljudest sammudest, millest igaüks võib olla lihtne, aga kui neid on 20, siis on nullist alustava vestluspartneri veenmine vaevaline — selle nähtuse nimi on inferential distance ehk (rohmakalt tõlkides) järelduslik kaugus. Kui intellektuaalne karkass on rääkija ja kuulaja peas sarnane, on inferential distance väike.
Näiteks: paljudest masinõppemeetodite mõistmiseks pead kõigepealt vektorruumidest aru saama; see omakorda toetub algebralise korpusele, ringile ja rühmale ning need hulga kui matemaatilise objekti mõistmisele. Või veidi elulisemalt: et aru saada, miks Uberi hinnamuutused (surge pricing) on tegelikult ka kliendile kasulikud, tuleb enne aru saada, mis on vaba turu eelised7 ja kuidas Uber turu efektiivsele toimimisele kaasa aitab8.
Paljud raamatud (eriti õpikud) ehitavad karkassi üles esimestes peatükkides ja kui umbes viiendasse peatükki jõudes nende põhisisu mäletad, on lugemine a) põnevam (sest saad paremini aru) ja b) produktiivsem (sest rohkem jääb meelde).
Praktiline päheõppimise tehnika: Anki kaardid
Minu teada parim viis ükskõik mille päheõppimiseks on Anki. Anki on rakendus (nii arvutitele kui telefonidele), millega saab luua pöördkaarte (flash card) ja neid õppida, kusjuures kaartide õppimisgraafik on eriline: Anki kasutab graafiku koostamiseks viiest tõendatult kõige efektiivsemast õppimistehnikast kolme. Minu kogemus sellega on ülipositiivne.
Pöördkaardil on ühel pool küsimus ja teisel pool vastus ning õpiprotsess koosneb küsimusele mõtlemisest ja vastuse meeldetuletamisest. Ideaalis on vastused väga lühikesed (võid lugeda täpsemalt, kuidas infot kaartidena formuleerida), seega võtab ühe kaardi kordamine ainult paar sekundit.
Mõned näited minu pöördkaartidest (vorming on Ankis muidugi parem):
Saksakeelsed sõnad
K: kass
V: die Katze
K: brauchen
V: vajama
Raamat “Joy on Demand“
K: the _____________ of physical exercise is meditation
V: the mental equivalent of physical exercise is meditation
K: the mental equivalent of physical exercise is ________
V: the mental equivalent of physical exercise is meditation
K: 2 types of itches for pleasure
V: 1. pleasure of the senses; 2. pleasure of the ego
Raamat “Intelligent Investor“
K: successful long-term investment requires 2 things: a sound intellectual framework for making investment decisions and _____________________________
V: successful long-term investment requires 2 things: a sound intellectual framework for making investment decisions and ability to keep emotions from corroding it
Magistritöö alusteadmised
K: in a Markov Decision Process, Q-learning iteratively updates Q-values using the ______ equation
V: in a Markov Decision Process, Q-learning iteratively updates Q-values using the Bellman equation
Anki sobib kõige paremini väikeste juppide meeldejätmiseks, aga väikestest juppidest saab kokku ehitada suure struktuuri, seega on ta üsna universaalne. Karin tegi Anki kasutamisest mõnusa video:
Lõpuks: kui tahad Ankit järgi proovida, aga ise kaarte teha ei viitsi, siis otsi avalikust Anki pakkide andmebaasist endale mõni põnevam.
Kokkuvõte
Kui loed põnevat blogipostitust või raamatut, siis kaalu, kas saadud info on väärt meeldejätmist (vaikimisi ununeb see kiiresti). Loomulikult pead tegema kompromisse, kuna ärksaid tunde ei ole lõputult — mina jätan sügavuti meelde ainult ideid, mis tunduvad pikas perspektiivis olulised –, aga väikegi pingutus tasub ennast avarduva mõtteruumi näol ära.
Jaga:
Märkused
- mis on seotud lühiaajalise mäluga, aga pole päris sama
- See seletaks, miks on töömälu vabastavad produktiivsustehnikad — näiteks suurte monitoride kasutamine — tohutult efektiivsed, ja miks programmeerijaid häirib eriti, kui nende keskendumist kogu aeg segatakse.
- milles mul laialdane kogemus on
- Anna teada, kui mingeid militaartermineid rängalt valesti kasutan.
- Mõtlen topoloogilist ruumi, mille analoogiana sobib füüsiline kolmemõõtmeline ruum siin hästi.
- Ma ei ütle, et suure erialase tasemevahega vestlused täiesti mõttetud oleks: õpetaja-õpilase suhtlus saab olla kasulik mõlemale ning ekspert võib algaja küsimustest olulisi ideid saada. Need on lihtsalt teistsugused suhtlusrežiimid.
- Autode puudust ei teki, sest tõusva nõudlusega tõuseb hind ning seetõttu ka pakkumine (kodust väljaronivate juhtide arv).
- Lubab hinnal nõudluse tõustes kasvada.
Kas sa oskaksid ka viidata psühholoogia-alast kirjandust, millel see pikaajalisse mällu talletatud info olulisuse argument põhineb? Tundub väga hästi sõnastatud ja loogiline seletus, aga tahaks algallikani jõuda.
Minu arusaam focused ja diffuse režiimi erinevusest ja chunkimisest pärineb raamatust A Mind for Numbers. Vaatasin praegu, et chunkimise kohta seal mingit üht selget viidet ei ole, seega soovitan sul kas lihtsalt raamatule viidata või siis otsida 4. peatüki viidetest hea allikas.
Kopeerin need igaks juhuks siia, kui sul raamatut käepärast pole.
1 Luria 1968.
2 Beilock 2010, pp. 151–154.
3 Children learn through focused attention, but they also use the diffuse mode, with little executive control, to learn even when they are not paying focused attention (Thompson-Schill et al. 2009). In other words, it seems that children don’t need to use the focused mode as much as adults do when learning a new language, which may be why it’s easier for young children to pick up a new language. But at least some focused learning appears necessary to acquire a new language beyond early childhood.
4 Guida et al. 2012, sec. 8. Recently, Xin Jin, Fatuel Tecuapetla, and Rui Costa revealed how neurons in the basal ganglia play an important role in signaling the concatenation of individual elements into a behavioral sequence—the essence of chunking (Jin et al. 2014). Rui Costa has received a 2 million euro grant to study the mechanism of chunking—his unfolding research will bear watching.
5 Brent and Felder 2012; Sweller et al. 2011, chap. 8.
6 Alessandro Guida and colleagues (2012, p. 235) noted that chunk creation apparently relies initially on working memory, which is in the prefrontal areas, and results from focused attention, which helps binds chunks. These chunks also begin to reside, with developing expertise, in long-term memory related to the parietal regions. A very different aspect of memory involves neural oscillatory rhythms, which help bind perceptual and contextual information from many areas of the brain (Nyhus and Curran 2010). See Cho et al. 2012 for an imaging study of the development of retrieval fluency in arithmetic problem solving in children.
7 Baddeley et al. 2009, chap. 6; Cree and McRae 2003.
8 Baddeley et al. 2009, pp. 101–104.
9 The “big picture” I’m referring to can be thought of as a cognitive template. See Guida et al. 2012, in particular sec. 3.1. Templates arising from the study of math and science would naturally tend to be more amorphous than those arising from the crisp outlines of chess. Chunks, Guida notes, can be built very quickly, but templates, which involve functional reorganization, take time—at least five weeks or more (Guida et al. 2012). See also the discussion of schemata in Cooper and Sweller 1987; Mastascusa et al. 2011, pp. 23–43. Also useful in understanding these ideas related to developing expertise is the discussion in Bransford et al. 2000, chap. 2. Prior knowledge can be helpful in learning something new and related—but prior knowledge can also act as a hindrance, as it can make it more difficult to make changes in schemata. This is particularly noticeable with students’ erroneous embedded beliefs about basic concepts in physics, which are notoriously resistant to change (Hake 1998; Halloun and Hestenes 1985). As Paul Pintrich and colleagues (1993, p. 170) note: “a paradox exists for the learner; on the one hand, current conceptions potentially constitute momentum that resists conceptual change, but they also provide frameworks that the learner can use to interpret and understand new, potentially conflicting information.”
10 Geary et al. 2008, pages 4-6 through 4-7; Karpicke 2012; Karpicke et al. 2009; Karpicke and Grimaldi 2012; Kornell et al. 2009; Roediger and Karpicke 2006. For reviews, see McDaniel and Callender 2008; Roediger and Butler 2011.
11 Karpicke et al. 2009, p. 471. See also the Dunning-Kruger effect, where incompetent people mistakenly note their ability higher than they should. Dunning et al. 2003; Kruger and Dunning 1999; Ehrlinger et al. 2008; Bursonet et al. 2006.
12 Baddeley et al. 2009, p. 111.
13 Dunlosky et al. 2013, sec. 4.
14 Longcamp et al. 2008.
15 Dunlosky et al. 2013, sec. 7.
16 See in particular Guida et al. 2012, which notes how experts learn to use long-term memory to expand their working memory. See also Geary et al. 2008, 4-5, which observes, “Working-memory capacity limits mathematical performance, but practice can overcome this limitation by achieving automaticity.”
17 The solution to the anagram is “Madame Curie.” Attributed to Meyran Kraus, http://www.fun-with-words.com/anag_names.html.
18 Jeffrey Karpicke and colleagues (2009) suggested the relationship between illusions of competence in learning and the difficulty of anagrams when you see the solution as opposed to when you don’t see the solution.
19 Henry Roediger and Mary Pyc (2012, p. 243) note: “Professors in schools of education and teachers often worry about creativity in students, a laudable goal. The techniques we advocate show improvements in basic learning and retention of concepts and facts, and some people have criticized this approach as emphasizing “rote learning” or “pure memorization” rather than creative synthesis. Shouldn’t education be about fostering a sense of wonder, discovery, and creativity in children? The answer to the question is yes, of course, but we would argue that a strong knowledge base is a prerequisite to being creative in a particular domain. A student is unlikely to make creative discoveries in any subject without a comprehensive set of facts and concepts at his or her command. There is no necessary conflict in learning concepts and facts and in thinking creatively; the two are symbiotic.”
20 Geary 2005, chap. 6; Johnson 2010.
21 Johnson 2010, p. 123.
22 Simonton 2004, p. 112.
23 This is my own rephrasing of a common sentiment in science. Santiago Ramón y Cajal cited Duclaux in noting, “Chance smiles not on those who want it, but rather on those who deserve it.” Cajal went on to note, “In science as in the lottery, luck favors he who wagers the most—that is, by another analogy, the one who is tilling constantly the ground in his garden” (Ramón y Cajal 1999, pp. 67-68). Louis Pasteur noted, “In the fields of observation chance favors only the prepared mind.” Related expressions include the Latin-based proverb “Fortune favors the bold” and the British Special Air Service motto: “Who dares wins.”
24 Kounios and Beeman 2009 [1897]; Ramón y Cajal 1999, p. 5.
25 Rocke 2010.
26 Thurston, 1990, p. 846–847.
27 See the foundational work of Karl Anders Ericsson on development of expertise (e.g., Ericsson 2009). For insightful popular approaches related to the development of talent, see Coyle 2009; Greene 2012; Leonard 1991.
28 Karpicke and Blunt 2011a; Karpicke and Blunt 2011b. For further information, see also Guida et al. 2012, p. 239.
29 Of interest is that left hemisphere prefrontal regions appear active during the encoding phase of memorization, while right hemisphere regions are activated during retrieval. This has been reported by many groups using a great variety of imaging techniques (Cook 2002, p. 37). Is it possible that retrieving memorized materials creates the beginnings of diffuse-mode concept mapping-like connections? See also Geary et al. 2008, 4-6 to 4-7.
30 There are, of course, caveats here. For example, what if a student is asked to recall material to determine what belongs on a concept map? There are also undoubtedly disciplinary differences. Some subjects, such as those involving communication processes in biological cells, inherently lend themselves more readily to “concept map” approaches in understanding key ideas.
31 Brown et al. 1989.
32 Johnson 2010, p. 110.
33 Baddeley et al. 2009, chap. 8.
34 Ken Koedinger, a professor of human-computer interaction and psychology at Carnegie Mellon University, notes, “To maximize retention of material, it’s best to start out by exposing the student to the information at short intervals, gradually lengthening the amount of time between encounters. Different types of information—abstract concepts versus concrete facts, for example—require different schedules of exposure” (quoted in Paul 2012).
35 Dunlosky et al. 2013, sec. 10; Roediger and Pyc 2012; Taylor and Rohrer 2010.
36 Rohrer and Pashler 2007.
37 It appears that “mass practice” techniques of presenting the material provide an illusion of competence in teaching. Students appear to learn quickly, but as studies have shown, they forget quickly as well. Roediger and Pyc (2012, p. 244) note: “These outcomes show why teachers and students can be fooled into using strategies that are inefficient in the long run. When we learn we are so focused on how we are learning, we like to adopt strategies that make learning easy and quick. Blocked or massed practice does this. For better retention in the long run, however, we should use spaced and interleaved practice, but while we are learning this procedure seems more arduous. Interleaving makes initial learning more difficult, but is more desirable because long term retention is better.”
38 Rohrer et al. 2013.
39 Doug Rohrer and Harold Pashler (2010, p. 406) observe: “. . . the interleaving of different types of practice problems (which is quite rare in math and science texts) markedly improves learning.”
40 Personal communication with the author, August 20, 2013. See also Carey 2012.
41 Longcamp et al. 2008.
42 For examples, see http://usefulshortcuts.com/alt-codes.