Yrittäjyys ja asenteet

Yksi asenne, jota näkee Piilaakso-henkisessä startup-kulttuurissa paljon ja jonka mielelläni näkisin leviävän Suomeenkin, on suhtautuminen yrittäjyyteen likipitäen altruistisena toimintana.

Tuossa kulttuurissa yrittäjä on ihminen, joka löytää uuden tavan parantaa muiden elämää, ja toteuttaa sen. Olen lukennut tuosta kulttuurista tulevia “miten ryhtyä yrittäjäksi”-artikkeleita, joiden sisältö on suunnilleen tiivistettävissä muutamaan askeleeseen: 1) keksi ihmisten elämästä niin monta puutetta kuin voit 2) keksi tapoja korjata nuo puutteet hyötyen asiasta samalla myös itse 3) valitse se puute, jonka pystyt korjaamaan mahdollisimman pienellä vaivalla mahdollisimman monelta 4) ryhdy hommiin. Yrittäjä on silloin sankari, joka parantaa muiden elämänlaatua. Hän ottaa tuosta hyödystä kylläkin oman osansa, mutta kaikki tunnustavat, että hänen muille tuottamansa hyöty on aina moninkertainen siihen nähden, mitä hän itse siitä saa.

Suomalaisesta julkisesta keskustelusta tuntuu kokonaan puuttuvan tämä asenne. Yrittäjyydestä puhutaan lähinnä tapana luoda työpaikkoja tai parantaa kansantaloutta. Nokiaakin tunnuttiin pitävän kansanaarteena lähinnä siksi, että se auttoi nostamaan maan lamasta – se, että se tuotti sadoille miljoonille ihmisille erinomaisia puhelimia tuntui olevan enemmänkin sivuseikka.

Tämän seurauksena ei varmaan ole ihmekään, ettei yrittäjyys tunnu juuri ihmisiä kiinnostavan, tai että markkinataloutta ylipäätään kohdellaan epäilyttävänä mörkönä. Yrittäjyys on muuttunut pelkäksi tavaksi luoda rahaa, ja sen rahantekemisen keinoilla ei ole juurikaan moraalista merkitystä itsessään. Saatetaan puhua yritysten yhteiskuntavastuusta, mutta sitäkin tunnutaan ajattelevan ikään kuin jonkinlaisena hyvityksenä siitä, että yritys ylipäätään on olemassa – pientä sivupuuhastelua, jolla firma oikeuttaa toimintansa jatkumisen. Ylipäätään työnteostakin tulee ihmisten mielissä vain inhottava ja kyseenalainen pakko, jota ihmisen on pakko harrastaa saadakseen rahaa.

Ja uskaltaisin veikata, että tämä voi hyvinkin päätyä itseääntoteuttavaksi ennustukseksi – kun liike-elämästä puhutaan vain keinona hankkia rahaa, niin sinne myös hakeutuvat pääasiassa ne ihmiset jotka kohtelevat sitä pelkkänä keinona hankkia rahaa, ja meno muuttuu askeleen kylmäverisemmäksi ja piittaamattomammaksi. Haluaisin lisää maailmanpelastajia liike-elämään.

Applying reinforcement learning theory to reduce felt temporal distance

Computer science for mind hackers: it is a basic principle of reinforcement learning to distinguish between reward and value, where the reward of a state is the immediate, intrinsic desirability of the state, whereas the value of the state is proportional to the rewards of the other states that you can reach from that state.

For example, suppose that I’m playing a competitive game of chess, and in addition to winning I happen to like capturing my opponent’s pieces, even when it doesn’t contribute to winning. I assign a reward of 10 points to winning, -10 to losing, 0 to a stalemate, and 1 point to each piece that I capture in the game. Now my opponent offers me a chance to capture one of his pawns, an action that would give me one point worth of reward. But when I look at the situation more closely, I see that it’s a trap: if I did capture the piece, I would be forced into a set of moves that would inevitably result in my defeat. So the value, or long-term reward, of that state is actually something close to -9.

Once I realize this, I also realize that making that move is almost exactly equivalent to agreeing to resign in exchange for my opponent letting me capture one of his pieces. My defeat won’t be instant, but by making that move, I would nonetheless be choosing to lose.

Now consider a dilemma that I might be faced with when coming home late some evening. I have no food at home, but I’m feeling exhausted and don’t want to bother with going to the store, and I’ve already eaten today anyway. But I also know that if I wake up with no food in the house, then I will quickly end up with low energy, which makes it harder to go to the store, which means my energy levels will drop further, and so on until I’ll finally get something to eat much later, after wasting a long time in an uncomfortable state.

Typically, temporal discounting means that I’m aware of this in the evening, but nonetheless skip the visit to the store. The penalty from not going feels remote, whereas the discomfort of going feels close, and that ends up dominating my decision-making. Besides, I can always hope that the next morning will be an exception, and I’ll actually get myself to go to the store right from the moment when I wake up!

And I haven’t tried this out for very long, but it feels like explicitly framing the different actions in terms of reward and value could be useful in reducing the impact of that experienced distance. I skip the visit to the store because being hungry in the morning is something that seems remote. But if I think that skipping the visit is exactly the same thing as choosing to be hungry in the morning, and that the value of skipping the visit is not the momentary relief of being home earlier but rather the inevitable consequence of the causal chain that it sets in motion – culminating in hours of hunger and low energy – then that feels a lot different.

And of course, I can propagate the consequences earlier back in time as well: if I think that I simply won’t have the energy to get food when I finally come home, then I should realize that I need to go buy the food before setting out on that trip. Otherwise I’ll again set in motion a causal chain whose end result is being hungry. So then not going shopping before I leave becomes exactly the same thing as being hungry next morning.

More examples of the same:

  • Slightly earlier I considered taking a shower, and realized that if I’d take a shower in my current state of mind I’d inevitably make it into a bath as well. So I wasn’t really just considering whether to take a shower, but whether to take a shower *and* a bath. That said, I wasn’t in a hurry anywhere and there didn’t seem to be a big harm in also taking the bath, so I decided to go ahead with it.
  • While in the shower/bath, I started thinking about this post, and decided that I wanted to get it written. But I also wanted to enjoy my hot bath for a while longer. Considering it, I realized that staying in the bath for too long might cause me to lose my motivation for writing this, so there was a chance that staying in the bath would become the same thing as choosing not to get this written. I decided that the risk wasn’t worth it, and got up.
  • If I’m going somewhere and I choose a route that causes me to walk past a fast-food place selling something that I know I shouldn’t eat, and I know that the sight of that fast-food place is very likely to tempt me to eat there anyway, then choosing that particular route is the same thing as choosing to go eat something that I know I shouldn’t.

Cross-posted to Less Wrong. Related post: Applied cognitive science – learning from a faux pas.

Bayesian academy game: A core mechanic

I feel like my progress with my academy game has been frustratingly slow. Lots of natural language, little code. Over Christmas leave I finally put together a simple Bayes net and belief propagation implementation, but when I was about to move on to start actually implementing the game side of things, I realized that some of the things that I had planned didn’t quite work after all. Then I got stuck for a while, trying to decide what would work in the first place. But then I fortunately started having new ideas, and finally came up with a core gameplay mechanic that would seem promising.

For example, suppose that the player wants to persuade an NPC to dance with her. Below is a representation of what the player character knows of the situation, somewhat similar to how it might be shown in the game.

Some of you will recognize this as resembling an influence diagram (but note that it doesn’t follow all the conventions of one, so if you do know influence diagrams, don’t try to read it literally as one). The rectangles, which would ordinarily be called decision nodes, are two possible dialogue options that the player has. She could try to take a flattering approach and say “I heard you’re a good dancer” in an attempt to appeal to the other’s vanity, or she could rather try to focus on his kindness and nurturing instinct by admitting that she herself has never danced before.

The ovals – uncertainty nodes – represent things that influence the way that the NPC will react to the different dialogue options. A character who’s confident of their dancing skills is going to react to flattery differently than someone who’s insecure about his skills.  The ovals form a standard Bayesian network (or several of them), meaning that the player can have differing amounts of knowledge about the different uncertainty nodes. Maybe she knows that the NPC has high self-esteem, and that this makes it more likely that he’s confident about his dancing skills, but she doesn’t know how good he actually is at dancing, which also influences his confidence about his skills.

Finally, the diamonds – usually called value nodes, but I call these reaction nodes – represent the different ways that the NPC might react to the various dialogue options. Depending on the values of the uncertainty nodes, flattery may please him, intimidate him, or make him react in an indifferent manner. In order to get the NPC to dance with her, the player has to elicit some number of positive reactions from the NPC, and avoid causing any bad reactions. A simple counter sums positive reactions minus negative reactions that have been caused while discussing the topic of dance: if it exceeds some threshold, he agrees, and if it falls below another threshold, he’ll refuse to even consider the thought anymore. The thresholds are partially determined by how big of a favor the player is asking for, partially by how much the NPC likes/trusts the player character.

Suppose the player doesn’t know much about this NPC, but she also doesn’t want to risk things by just saying things that might or might not upset him. Now, in addition to picking one of the dialogue options, she can also experiment with the network to see which variables would influence his decision the most. Suppose that she is considering the “appeal to kindness” route, and has determined that he really needs to be kind in order for this strategy to work. Now she can select the kindness node, and bring up a different set of dialogue options which are aimed at revealing how kind he is. But here too she needs to be careful, because another counter also tracks the NPC’s overall interest in the conversation. If she gets too many indifferent or negative reactions while talking about his kindness, he may just end the conversation and wander off, before she has ever had a chance to get back to the topic of dance. So there’s also an element of risk there.

Alternatively, if the player doesn’t think that getting to dance is that important after all, she can just try her luck with one of the original dialogue options. Maybe those will reveal something about the NPC that’s useful for something more important. After the conversation is over, the NPC’s basic liking for the player character may be adjusted depending on the total positive and negative reactions that she got out of him.

It’s also easy to add additional different complications or advanced options: e.g. an option to pressure the NPC into something, which if successful contributes points for the goal counter, but reduces their liking for you afterwards.

So that’s the basic mechanic. Notice that this basic structure is a very flexible one: instead of talking to an NPC, the player character could have broken into his room in order to look for her stolen necklace, for instance. In that case the decision nodes could represent different places where the necklace might be, the chance nodes might offer chances to look for clues of where he might have hidden the necklace, and the “hit point” counters might represent time before someone shows up, or before the player character loses her nerve and decides to get out. So the same mechanic can be recycled for many different situations.

As for the educational content, the fact that you’ll need to read the Bayes network involved with each variable in order to decide what to do should teach a bunch of useful things, like a basic ability to read the network, evaluate the value of information related to each chance node, and notice and understand d-separation. Not to mention coming to understand how many different situations can all be seen through the same probabilistic framework. And it ought to all relate to the game content in a meaningful manner.

(I also have lots of ideas for other core mechanics. I also should really get the first version of this game done eventually. So I’m making a note of all those other ideas, but for now I’ll focus on milking this core mechanic for all that it’s worth.)

One interesting question is: should the results of the decision nodes be deterministic or random? In other words, suppose the player knows the values of every node that influences e.g. the outcome of the flattery dialogue option. Does that mean that they know what the outcome of choosing that option will be? Or do they only know the odds of each outcome?

I’m inclined with going for the deterministic route: if you know everything that influences the outcome, then you know the final result. I’m not sure that having a random factor in there would be all that realistic, and more importantly, if you’ve spent your time and resources on discovering the value of every parent node of an option, then you deserve to know exactly what outcome your choice will have, rather than getting screwed over by a 10% chance for an unexpected result. And if you don’t know the value of each parent, then there will effectively already be a random factor involved in terms of what you don’t know.

This should hopefully be my last post before I actually have a playable prototype done. Even if a very short one.

Nyky-yhteiskunta ja motivaation kuolema

Päivän Hesarissa olleesta mielipidekirjoituksesta:

Kaikki lapset aloittavat innokkaina ekaluokan, mutta osalta motivaatio loppuu jatkuvien epäonnistumisten takia jo alakoulussa. […] Opeteltava aines on käsitteellistä, ja niinpä lapsi ei voi ymmärtää asioita, ne on vain muistettava. Minäkin olen yrittänyt opettaa 11-vuotiaalle väkisin kirkon herätysliikkeitä ja renessanssia – enkä ymmärrä miksi. […]

Nyt pitäisi huolestua siitä, miksi niin monen motivaatio katoaa peruskoulussa. Näin menetetään hyviä rakentajia, hitsareita ja lähihoitajia. Vielä murheellisempaa on itsetunnon ja tulevaisuuden toivon heikkeneminen, kun nuori joutuu vuodesta toiseen olemaan mukana toiminnassa, jossa hänen kykyjään ei arvosteta.

Tästä tuli väistämättä mieleen Aamulehdessä tuoreeltaan ollut voimakassanainen teksti siitä, miten joitakin nuoria “ei vain kiinnosta”:

Mitä tarjoaisitte 22-vuotiaalle miehelle, joka kertoo haluavansa ”vain istua tietokoneella”? Siis räplätä aamusta iltaan ja päivästä toiseen tietokonetta ilman sen kummempaa tavoitetta. Entä 23-vuotiaalle miehelle, joka on viimeisen viiden vuoden aikana aloittanut ja lopettanut kuusi toisen asteen koulutusta, koska ”oikein mikään ei kiinnosta”? Mikä voisi olla sopiva paikka 27-vuotiaalle naiselle, joka on aloittanut ja lopettanut toistakymmentä koulutusta, kun ”mikään ei tunnu siltä oikealta ja omalta jutulta. Mieluiten olisin vain kotona ja silleen”? […]

Entäpä nuorten kouluttaminen? Kuvitellaan, että heidät saataisiin sijoitettua johonkin koulutukseen, vaikka he eivät itse sinne haluakaan. Minkälaisia tuloksia odottaisitte henkilöiltä, joilla ei ole vähäisintäkään opiskelumotivaatiota eikä oikein opiskeluun vaadittavia kykyjäkään, sillä heidän aiemmat pohjatietonsa ovat joko hyvin vaatimattomia tai puuttuvat kokonaan?

Niin. Mistäköhän se puuttuva motivaatio mahtaisi johtua?

Aikoinaan ammatti saattoi periytyä vanhemmilta lapsille, ja lapset oppivat suoraan vanhemmiltaan sekä työn että kokemuksen sen merkityksellisyydestä. Nykyään tuollaisia ammatteja ei enää hirveästi ole, eivätkä elokuvien ja TV-sarjojenkaan sankarit juuri toimi esikuvina jotka motivoisivat mihinkään realistiseen työhön. Koulun työelämäperehdytys taas on lähinnä nimellistä, ja merkittävä osa ajasta menee siihen, että käydään läpi sisältöä joka on liian teoreettista ja elämästä irrallaan olevaa. Eivät ne työ- ja opiskelumotivaatiotkaan tule tyhjästä, ne tarvitsee oppia ja niitä tarvitsee varjella. Jos niitä ei mistään anneta, ja merkittävä osa nuoruudesta kuluu ympäristössä joka aktiivisesti tukahduttaa niitä, onko silloin mikään ihmekään jos aikuisiän tullen on lakannut kiinnostamasta?

Ja entäs sitten me, joilla ei ollut samanlaisia ongelmia teoreettisen sisällön kanssa? Väittäisin meilläkin olevan vaikeuksia, ne vain eivät ole yhtä ilmeisiä. Me mukauduimme siihen teoreettiseen, abstraktiin opetukseen siinä määrin, että konkreettisemmat asiat alkoivat käydä vieraammiksi. Kun ympäristö ei palkitse minkään oikean tekemisestä, ajatus minkään oikean tekemisestä alkaa tuntua epämiellyttävältä. Itse vierastin koulussa muita kuin lukuaineita, koska aineet joissa tarvitsi oikeasti tehdäkin jotain eivät olleet yhtä helppoja ja vaivattomia kuin sellaiset, joissa riitti ajatella ja painaa asioita mieleen. Koulumenestyksestä huolimatta minulla oli usein heikko itsetunto, osittain siksi, että tiedostin miten teoreettista ja elämästä irrallista olivat ne asiat, joihin olin keskittynyt. Joo, olin hyvä koulussa, mutta olisinko hyvä missään oikeaan elämään liittyvässä? (Ja mitä koulusta kertoo, että sitä niin helposti ajattelee erillisenä “oikeasta elämästä”?)

Kelataan vähän eteenpäin, yliopistoaikaan. Itselläni oli tuuria – onnistuin löytämään opiskelun lisäksi useitakin asioita, jotka tuntuivat mielekkäältä tekemiseltä. Silti niihin oli usein vaikea löytää energiaa, eikä hirveän moni niistä ollut sellainen, jolla olisi saanut laskut maksettua. Ajatus töihin hakeutumisesta hirvitti jollain tasolla pitkään, koska juuri mikään “oikea” työ ei tuntunut millään tasolla motivoivalta. Etenkin kun akateemisestakin urasta oli ehtinyt kuulla kaikenlaista epämotivoivaa siitä, miten vaikeaa aitoon tutkimukseen keskittyminen nykyisen jatkuvan julkaisupaineen ja apurahanmetsästyksen aikana on. Onneksi “pelastuin” ja onnistuin löytämään töitä joihin en koe vastenmielisyyttä, mutta lähellä se oli.

Asiaa ei myöskään yhtään auta valtiomme ihana tapa heittää yrittäjät miltei kokonaan turvaverkkojen ulkopuolelle. Opintotuella varassa eläessä nyt vielä uskaltaakin harrastaa pientä sivutoimintaa ja koettaa muuttaa niitä kiinnostuksenkohteitaan tulonlähteiksi, mutta ei siihen hirveästi voi keskittyä kun pitäisi niitä opintopisteitäkin saada. Opintotukisysteemin ulkopuolella työn onkin sitten parempi olla saman tien itsessään kannattava, ellei halua ottaa valtaisia riskejä.

Nykyaikanahan luovilla ihmisillä olisi tietenkin mahdollisuus koettaa esimerkiksi kerätä ilmaislevitykseen laittamillaan teoksilla fanikuntaa ja sitten hankkia joukkorahoituksella rahaa, mutta ai niin, sekin on Suomessa pyritty tekemään mahdollisimman vaikeaksi.

Ei se motivaation litistäminen rajoitu mitenkään kouluaikaan, kyllä se jatkuu ihan aikuisiälläkin.

Eräs ystäväni kirjoitti (englanniksi, vapaa suomennos omani):

…meidän elämiämme varjostava pelko ei ole rikollisuus vaan turhuus. Mitä jos päädymme kasvaessamme vain kroonisen alityöllistettyiksi, lapsellisiksi, muista riippuvaisiksi? Etenemme palkattomasta harjoittelusta lainarahoitteisiin jatko-opintoihin, vanhempiemme taloudellisella avustuksella, aina epävarmoina siitä olisiko meistä mihinkään omin voiminemme? Jotkut ikätoverini kohtasivat sen kohtalon. Minusta tuntuu kuin olisin vain hädin tuskin välttänyt sen. […]

Puhe “sukupolvista” on aina harhaanjohtavaa. Silti tuntuu siltä, kuin ikäkohortissani olisi paljon ihmisiä joiden määrittävä piirre on, että he elävät omassa yksityisessä helvetissään koska eivät osaa mitään. Siitä ei saa tehtyä hyvää tragediaa televisioon. Siitä ei myöskään saa hyvää komediaa. Se on pikemminkin kaihon ja kuvottavuuden välimaaston värittämä montaasi.