Sopa de Método: dezembro 2011

14 de dez. de 2011

Statistics of Mental Imagery

Francis Galton, primo de Darwin, estudou tudo que se tem notícia. E um artigo perdido entre as centenas que ele publicou trás sua contribuição para a estatística no campo da psicologia.
No ultimo quarto do século XIX, não era comum utilizar estatística como ferramente para se analisar dados no campo da psicologia, por isso que Galton (1880) se denomina o pioneiro nessa aproximação. Sua contribuição é extremamente relevante por descrever a análise comparativa de grupos aliado ao uso de escala não paramétrica.
O estudo de Galton (1880) era sobre imagens mentais, e quanto cada imagem se aproximava da realidade de acordo com os critérios de luminosidade, definição e cor. Para tal ele entrevistou 100 homens e os agrupou por nível de formação intelectual. Para cada grupo ele organizou as respostas da que dizia que a imagem mental era mais real até a menos real, e desta forma, construiu a primeira escala assertiva da história que se tem registro. Galton (1880) tinha consciência de que formava uma escala, porém não considerou que ela poderia ser aplicada a outros respondentes. Seu modelo de construção é exatamente igual ao utilizado pelos teóricos do século seguinte.
As afirmações organizadas foram uma escala, porém ela só é válida em termos relativos. Ao contrário das demais medidas métricas, Galton (1880) observou que não havia instrumento externo que pude-se ser utilizado para se mensurar a imaginação das pessoas, então, havia um grande problema para a comparação de grupos.
Como forma de amenizar esse problema, Galton (1880) assumiu que todas as medidas era relativas dentro de uma escala arbitrária (ou não paramétrica) e por tanto algumas estatísticas eram mais favoráveis que outras. É o caso da mediana em relação a média. A mediana para Galton (1880) representa uma medida real, que de fato existe e é representada pelo caso central da distribuição. Se não houver um parâmetro externo como referência, não é possível conhecer o valor dos intervalos, e o cálculo da média, por definição, é inapropriado.
A comparação de grupos ordenados por escalas não paramétricas não pode ser feito pela média. Galton (1880) sugere que o mais indicado é compará-los através da mediana e dos quartis. Desta forma os cálculos irão respeitar o grau de reatividade da escala.

13 de dez. de 2011

A Technique for the Measurement of Attitudes by Likert

Rensis Likert findou por ser o mais famoso dos metodólogos. Sua contribuição para outras áreas é bastante relevante, mas absolutamente nada se compara ao sucesso do seu artigo de 1932 que deu seu nome a praticamente todas as formas de escala assertiva que utilizamos atualmente. É verdade também que do trabalho original para os livros atuais, há uma diferença tão grande que o próprio Likert não se reconheceria, mas sem dúvida alguma pode-se afirmar que "A technique for the Measurement of Attitudes" modificou a história das escalas. A diferença é tão grande, que mesmo sem ter conhecimento da data de publicação, é possível dizer, apenas lendo o artigo, se ele foi publicado antes ou depois de 1932.
O estudo de Likert se estendeu entre 1929 até 1932, então é fácil encontrar publicações anteriores a dele tratando do mesmo tema, o que não reduz a importância do feito.
A construção de escalas de atitude no final da década de 1920 e inicio da década de 1930 era baseado principalmente em Thurstone (1928) que sugeriu utilizar assertivas ordenadas como forma de mensurar as atitudes das pessoas. Likert (1932) adotou a mesma teoria vigente, porém, introduziu a sua contribuição. Para Likert (1932) a atitude não pode ser mensurada a partir de uma opinião, ela na verdade é fruto de um conjunto de opiniões. Essa proposta não é inédita, Thurstone (1928) já havia dito isso, porém apenas Likert (1932) conseguiu transformar esse entendimento em uma forma operacional de mensuração de atitudes.
O conjunto de atitudes que uma pessoa pode ter varia de acordo com o conjunto de estímulos que ela poderá receber, e desta forma as possibilidades são infinitas. Sendo assim, capturar a atitude de uma pessoa através de uma única opinião é impossível segundo Likert (1932). Desta forma não existe uma escala com pontos definidos, as possibilidades de atitudes são infinitas, e marcar apenas um ponto no continuo é impraticável.
A mensuração de atitude é em essência indireta. Ela ocorre a partir das opiniões, sendo assim existe uma flutuação natural das respostas que pode ser minimizada ao se considerar um conjunto de assertivas ao invés de apenas uma como grau da escala. Somando-se esse fato a incredibilidade de Likert (1932) em se conseguir mensurar um fenômeno complexo com apenas uma afirmação, aceita-se a condição de que atitude é em verdade um cluster de opiniões estão internamente ligadas umas as outras.

Construção da escala
Em sua pesquisa sobre internacionalismo, racismo, economia, política e religião fora, Likert (1932) seguiu rigorosamente os passos de Thurstone (1928). As opiniões foram coletadas a partir de entrevista com especialistas, declarações em jornais e revistas comerciais e de alguns livros. As afirmativas foram editadas de forma a se encaixarem com os requisitos básicos de simplicidade, claridade e brevidade. Sem exceções , as questões apresentadas deveria apresentar um julgamento de valores e não de fatos.
Sobre julgamento de valores em oposição a fatos, o que se observa em Likert (1932) é que não foram utilizadas afirmativas que remetessem a acontecimentos passados, apenas a possibilidades futuras, isso para eliminar algum julgamento prévio das pessoas e sobretudo do ambiente.
O teste foi realizado com 2000 respondentes, das quais apenas 650 foram consideradas válidas.

Tipos de escala
Quatro tipos de escala foram utilizados por Likert (1932). Todas elas foram convertidas em números para análise, é o valor entre parenteses.

1. De três pontos, sendo as alternativas "SIM" (4), "NÃO"(2) e "?" (3).
2. Múltipla escolha, sendo 5 afirmativas de "a"(5) à "e"(1) onde cada opção traz uma assertiva diferente e ordenada.
3. De cinco pontos, onde há uma série de afirmativas e os respondentes devem assinalar sua concordância em graus de "aprovo fortemente" (1), "aprovo" (2), "indeciso"(3), "desaprovo"(4) e "desaprovo fortemente"(5).
4. De cinco pontos, exatamente igual a anterior, mas ao invés de afirmativas, foi utilizado relato de notícias.

Já observamos de cara que a escala Likert tem 5 pontos e não 7 como pregam alguns. Outra constatação interessante é o peso dos 5 pontos, que parece invertido em relação a maioria dos estudos atuais.

Análise
São duas formas de análise sugeridas por Likert (1932), ambas segundo ele levam ao mesmo resultado (ou valores similares). A primeira é através do sigma (distância entre os pontos e a média). O outro é a soma de pontos.
A tabela abaixo representa o percentual de respondentes que marcaram cada alternativa e o sigma (distância da média) de cada uma delas. A média das distâncias representa a atitude do respondente naquela questão. Como a atitude é definida por um conjunto de afirmativas, e não apenas uma, o que contará é a média das médias para cada cluster.

No caso da análise por soma de pontos, é considerado o valor da alternativa marcada pelo respondente em cada afirmativa, e ao final, a atitude é revelada pelo somatório destes pontos, e não pela média. Observa-se que, para facilitar os cálculos, não há valores negativos e todas as afirmativas devem estar no mesmo sentido, ou seja 1 deve sempre representar a atitude A e 5 o seu oposto. Para as questões de 3 pontos, não existem os valores 1 e 5.
Algumas observações metodológicas foram apresentadas por Likert (1932). O número de alternativas não interfere no resultado, sejam elas 3 ou 5. Entretanto, a de 5 pontos parece mais satisfatória. O resultado final da análise por somatório ou por média é similar e não interfere a interpretação final, sendo o método um critério de escolha do pesquisador.

Validação
A consitência interna da escala é calculada através de uma correlação entre as respostas assinaladas a questões pares e a questões ímpares. Como supostamente ambos mensuram o mesmo fenômeno, o coeficiente de correlação de ser superior 0.90. Se as afirmativas forem dispostas aleatórias no questionário, a seleção de pares e ímpares também terá esse critério, por consequência, o que fortalece o teste. A próxima tabela demonstra a probabilidade de erro para cada tamanho de amostra e valores de correlação.

7 de dez. de 2011

Como construir uma escala por Thurstone (1928)

Thurstone (1928) assumiu que havia um problema na mensuração de atitude da época e se propôs a estudá-lo. Antes de mais nada é preciso entender que atitude é um conceito que abrange o conjunto de sentimentos, noções pré-concebidas, ideias, medos, ameaças e convicções sobre algum tópico específico. E a expressão verbal da atitude é denominada opinião.

A proposição de Thurstone (1928) é de mensurar atitude através da conformidade do indivíduo com opiniões, e sobre a limitação de não se ter certeza se a pessoa mente ou fala a verdade na hora de responder ao questionário, Thurstone (1928) se defende argumentando que o que está se mensurando é a atitude que a pessoa quer demonstrar, e isso deverá estar em conformidade com seus atos pois é mais provável que haja coincidência que contradição entre as respostas e as atitudes. Sobe-se também que situações livres de pressões sociais e grande número de respondentes são também uma solução eficaz contra essa limitação. Sempre haverá flutuação da mensuração, e para tomar conhecimento deste erro é necessário calcular o desvio padrão.

Quando se compara pessoas em relação a algo é possível que esta comparação seja multi dimensional. Nesses casos o método de aplicação de escala não é indicado por Thurstone (1928), a indicação é apenas para as situações onde pode-se comparar pessoas de acordo com algum critério que resulte em A é mais X que B ou A é menos X que B. Nessas comparações do tipo 'mais ou menos', Thurstone (1928) acredita ser possível a mensuração por escala linear. Exemplo de escala linear é quando afirma-se que A possui mais educação que B, e nesses casos a unidade da escala não necessita ser física, assumindo-se (na maioria dos casos) uma escala abstrata.

O primeiro passo da construção de uma escala é restringir qual variável será mensurada. Após definir a temática, Thurstone (1928) ensina que deve-se isolar algum aspecto da atitude que possa servir de comparativo entre as pessoas utilizando-se da lógica 'mais ou menos'. Se essa condição for atingida, haverá linearidade para se elaborar uma escala.

Embora cada pessoa marque apenas uma alternativa, Thurstone (1928) reconhece que atitude não é apenas isso. É na verdade um conjunto de pontos infinitos ao redor da marca do respondente, pois em uma escala ideal é impossível determinar em um continuo se o ponto de melhor aderência é algum ou seus vizinhos imediatos. Atitude é então definida como um conjunto estreito de opiniões infinitamente próximas.

Essa raciocínio é exemplificado pelo gráfio de distribuição de frequência na figura 1. Mesmo que só haja frequência para os pontos a,b,c,d,e,f (já que só eles existem no questionário) a frequência dos intervalos foi estimada. Então quando Thurstone (1928) se refere a uma atitude, ele está na verdade se reportando a um conjunto de pontos vizinhos na escala de atitude.

É por esse motivo que o gráfico de distribuição de Allport e Hartman (1925) não é considerado correto. De acordo com Thurstone (1928), eles apenas apresentam as frequências de cada item, mas não conseguem elaborar uma curva de distribuição, Allport e Hartman (1925) também não se atentaram para o intervalo entre as afirmativas, ou seja, a proposição de 25 não é propriamente uma escala, mas um questionário multi-items.

A escala de atitude é utilizada para mensurar uma pessoa, mas Thurstone (1928) afirma que ela também pode ser estendida a um grupo se forem consideradas as médias. Sendo assim é possível comparar diferentes grupos em relação a suas atitudes sobre algum tema específico.

As opiniões (representadas pelas afirmativas) são os marcos da escala, e para o propósito de se desenhar uma curva de distribuição de frequência é conveniente para Thurstone (1928) escolher as assertivas de forma que a distância entre eles no continuo seja uniforme.

Para garantir que a ordem das afirmativas estejam em uma ordem que realmente forme uma escala linear, Thurstone (1928) sugere enviar as opiniões para grande grupo de pessoas (centenas) e solicitar que eles sugiram uma ordem para as frases. É importante que as pessoas responsáveis por dar ordem não sejam as mesmas que deram as opiniões, para evitar viés. A lógica é que se a alternativa A em 51% ou mais dos casos estiver a direita ou a esquerda de C, este é o lugar certo, mas se receber 50% de indicação para um lado e os outros 50% para o outro, é interpretado que ambas as frases representam o mesmo ponto na escala.

Método de construção de escalas por Thurstone (1928)

1. Diversos grupos de pessoas devem escrever suas opiniões sobre determinado assunto para criar um banco de dados;

2. A literatura deve ser revisada em busca de afirmativas que sirvam para a escala;

3. Uma lista inicial contendo entre 100 e 150 frases é editada para servir de base a escala, nesta lista deve-se verificar se existem afirmativas candidatas a todos os pontos da escala, inclusive os pontos neutro, para evitar que a transição seja abrupta entre os dois lados;

4. As frases devem ser impressas em papeis separados e enviadas a duas ou três centenas de pessoas que irão organiza-las em ordem, de um extremo ao outro;

5. A organização das frases aleatórias consiste em agrupar o conjunto de todas as afirmações em 11 grupos, apenas os dois grupos extremos são rotulados (por exemplo, conservador e liberal), o grupo central é o ponto neutro. Desta forma serão cinco grupos para cada lado da escala mais um neutro central;

6. Pela observação da frequência de cada frase em determinado grupo, é definido a escala.

O artigo de Thurstone (1928) infelizmente não deixa claro quais frase de cada grupo são eleitas ser incluídas na escala final. Acredita-se que pela maior frequência seja um critério válido, mas se entende-se que todas as frases tem o mesmo peso (ou pesos vizinhos e por tanto compatíveis), qualquer escolha deveria satisfazer o objetivo.

As regras para elaboração das assertivas são:

1. A afirmação deve ser a mais resumida possível;

2. Não pode ser dúbia de forma que duas pessoas classifiquem a mesma frase como pertencente aos dois extremos;

3. Toda frase deve expressar alguma atitude que o respondente possa ter em relação ao tema;

4. Deve-se priorizar orações simples, como forma de reduzir a dubiedade;

5. É preciso ter certeza de que todas as frases estão realmente abordando o mesmo tema.

O método de validação de Thurstone (1928) é baseado no gráfico da figura 2. É um gráfico da curva phi-gamma e a leitura é da seguinte forma. As curvas marcam a amplitude em que cada curva foi classificada (entre os 11 grupos). Quanto menor a amplitude mais confiável, quanto maior, menos confiável.

Outra técnica de validação consiste em elaborar curvas de frequência individuais. Por exemplo, solicita-se que todas as pessoas que escolheram uma alternativa do grupo 4 que escolham uma segunda alternativa. Se as respostas se concentrarem entre os grupos 3 e 5 não há problemas, mas se houver um pico de respostas em 1 ou 8, significa que a afirmativa inicial de 4 deve ser excluída.

Aplicação da escala de atitudes por Thurstone (1928)

Os respondentes recebem 25 afirmações e devem marcar um sinal de positivo nas frases que concordam e um negativo nas que discordam. O somatório de pontos de cada indivíduo revela sua atitude em relação ao tema estudado.

A Validação de Grim

Paul R. Grim (1936) não é uma referência clássica em metodologia e raramente é citado em estudos de construção de escala. Na verdade sua contribuição, nem contribuição é, foi a sugestão de validação de escala com base em quase nada. É um método um tanto descriterioso, mas de toda forma, é um registro importante, afinal, aprendizado envolve também o que não dá certo. Nem que seja para não repetir.
Devido a alta subjetividade envolvida na mensuração de atitudes Grim (1936) sugere uma validação alternativa através da observação informal das ações dos estudos, conversas, discussões e exame dos trabalhos escritos que eles produzem. A escala é então validada através da comparação entre a opinião escrita que os alunos entregam com a impressão que o professor tem deles de acordo com a observação informal.
Esse método obviamente não funciona e não precisa de maiores esclarecimentos. É na verdade um atentado metodológico.
A parte from that, Grim (1936) faz a descrição de uma análise de dados com bastante detalhes, e por isso vale ler o artigo.
As assertivas não são escalonadas de acordo com os métodos de Thurstone (1928), Grim (1936) segue o movimento pós-Likert (1932) onde cada afirmação tem um peso próprio e o respondente deve indicar o grau de concordância com ele. A análise foi feita da seguinte forma, um grupo de especialistas analisou as 10 assertivas e determinou quais eram liberais ou conservadoras (já dá pra notar que a validação não serve de nada nem pra ele). Após a coleta foi atribuído números (pesos) as respostas, quem marcou que 'concorda' com uma afirmação conservadora recebia um valor 4, se tivesse assinalado que 'concordava fortemente' o peso era 5. Se o respondente marcasse o ponto 'neutro' o valor atribuído era 3, independente da afirmação ser conservadora ou liberal. A opção 'não concordo' quando marcada em uma assertiva conservadora recebia o valor 2 e o peso 1 era dado para a opção 'não concordo fortemente' em frases conservadoras. O mesmo raciocínio era utilizado para as afirmações liberais.

A tabela acima apresenta os resultados do estudo após tabulados sobre a regra de análise de Grim (1936).

6 de dez. de 2011

Quem inventou a escala assertiva para mensurar atitude?

Likert, o famoso, se referencia em Thurstone que se referencia em Allport que não se referencia em ninguém. Eu já sei que existem publicações mais antigas que Allport, mas vou manter o segredo. Por hora, o trabalho mais antigo a descrever uma escala assertiva para mensurar atitudes foi Allport e Hartman (1925) no artigo "The Measurement and Motivation of Atypical Opinion in a Certain Group" que só pode ser encontrado em base de dados privadas.
Allport e Harman (1925) já conheciam a influência das diferentes personalidades nas atitudes das pessoas, o que lhes faltava era um método de mensuração que fosse possível identificar essas diferenças. Um procedimento lógico para tal parecia se primeiramente mensurar as personalidades presentes em uma amostra e em uma próxima etapa selecionar uma amostra representativa de cada personalidade e mensurar sua opinião em relação a algum fato.
A técnica de voto arbitrário (pessoas se posicionar contra ou a favor de algo) já era conhecida e utilizada, mas não representava ainda um método cientifico por falta de rigor e padronização. Por este motivo Allport e Harman (1925) alertavam que "uma escala cuidadosamente graduada e padronizada era necessária para qualquer mensuração, seja física ou psicológica." (p.736)
Allport e Harman (1925) criaram um método de elaboração de escalas da seguinte forma. Sessenta estudantes foram convidados a escrever suas opiniões pessoais sobre vários temas. Essas frases foram organizadas por temas e imprimidas em pedaços individuais de papéis. Seis juízes (professores de ciência política e psicólogos) ordenaram as frases de forma a construir uma escala contínua onde os extremos caminhassem para posições opostas e o centro permanecesse o mais neutro possível.
Com a escala pronta, outra amostra de estudantes que foram convidados a ler as assertivas da escala e escolher a que mais representava sua opinião. Após essa escolha ele deveria assinalar em uma escala de 5 pontos qual o seu grau de certeza sobre aquela escolha, a variação era de extremamente incerto até extremamente certo incluindo o ponto neutro. Havia uma outra escala onde o respondente deveria marcar, também entre 5 pontos, qual o seu grau de interesse ou sentimento pelo tema da escala (ALLPORT; HARTMAN, 1925).
Já naquela época Allport e Harman (1925) se desculpavam por terem realizado a coleta de dados com estudantes de graduação, que obviamente não são representativos da população e justificam essa escolha pelo fato de apenas terem interesse em desenvolver um método de criar escalas e não nos resultados.
Allport e Harman (1925) observaram que quanto mais extrema era a opinião do respondente, mas certeza ele indicava ter de sua opinião, e logicamente, quanto mais neutro, menos certeza. Eles não apresentaram muita sofisticação na análise que basicamente incluía uma média, uma distribuição de frequência e comparação da área do gráfico, como pode ser visto abaixo.

O histograma superior representa a frequência de respondentes que afirmaram simpatizar mais com determinada afirmação. A numeração de 1 a 12 em algarismo romano representa a posição de cada afirmação. O gráfico inferior parece mas não é um histograma, é na verdade a representação das médias de certeza que os respondentes de cada assertiva marcaram. A linha pontilhada é o ponto neutro, que nesse caso é variável e não é necessário estar no centro. Quem determina a ordem das assertivas e o ponto neutro é o conselho de especialistas.

1 de dez. de 2011

A mensuração de atitudes por Thurstone

L.L. Thurstone contribui fortemente para a teoria de mensuração de atitudes, até o momento é a primeira referência que tenho sobre desenvolvimento de escalas (há uma suspeita não confirmada de uma publicação anterior).
Antes de mais nada é importante definir o que é atitude. Atitude é o afeto por ou contra algum objeto psicológico (THURSTONE, 1931).

Sua argumentação é em torno de construir um mecanismo de mensuração (ele ainda não chamava de escala). O passo inicial é provar logicamente como é possível extrair respostas confiáveis através de intervenções empíricas. O desafio então é armar uma lógica racional que consiga construir resultados pragmáticos através de observação empírica de algo relativo mas não exatamente o objeto de estudo. Clarificar-lo-ei:

A logica que ele buscou se baseou em uma pesquisa sobre atitude em relação a nacionalidades. A mensuração anterior a invenção da escala assertiva era realizada através da escala comparativa, onde o respondente se posicionava entre duas opções opostas dadas pelo pesquisador. Não havia a ideia de continuo, então as perguntas era do tipo, entre francês e alemão, qual das duas nacionalidades você prefere.

A proposição de Thurstone (1931) era de que essa pergunta poderia ser repetida inúmeras vezes e por alguma lógica fornecer uma descrição objetiva mais precisa que os métodos antigos (baseados em limiares psicológicos).

Quando um método constante é utilizado de forma completa, então os estímulos resultantes se tornam um padrão, dando origem ao método de comparação pareada. Não havia lógica quantitativa para manusear o método da comparação pareada na década de 30, então para se obter uma mensuração era necessário satisfazer aos critérios de consistência interna. A dificuldade então era de se obter uma equação que satisfaça esse critério, esse processo se denomina lei do julgamento comparativo (THURSTONE, 1931).

Em seu teste, Thurstone (1931) apresentou uma lista com 20 nacionalidades a centenas de estudantes. As nacionalidades eram dispostas em pares, então cada nacionalidade seria comparada com todas as demais da lista. Os respondentes foram solicitados a sublinhar qual das duas nacionalidades e cada par ele gostaria de estar associado. Os dados foram tabulados no formato "proporção dos estudantes que preferiram a nacionalidade A em detrimento de B". Com as proporções e observando a lei do julgamento comparativo, os cálculos foram realizados para cada par. Por estes dados foi possível construir uma escala linear de atitude onde cada nacionalidade foi alocada.

É sabido das limitações estatísticas da época, então a análise foi feita com a seguinte lógica. Os pesos foram ignorados e as respostas indicavam que a maioria preferia A em relação a B, ou em caso dos percentuais ficarem muito próximos a 50%, era definido que não havia diferença entre as duas nacionalidades. Percebe-se que a lógica da escala assertiva nasce com este teste, pois a escala intervalar segue em linhas gerais a mesma lógica. E pela lógica de qual nacionalidade venceu mais confrontos, pode ser estabelecido um continuo de nacionalidades.

Os percentuais, embora fáceis de calcular, foram ignorados pelo fato de que haviam diversas limitações de amostragem neste teste, e como forma de manter a validade interna, preferiu-se dar apenas o vetor como resultado, ignorando a força. Uma delas foi o fato de haverem na lista não apenas nacionalidades, mas também grupos étnicos como Judeus, Negros e Latinos. Thurstone (1931) também argumenta que é possível que os respondentes simplesmente tenham preconceito com algum desses grupos e mesmo sem conhece-los a fundo, o marquem como pior opção.

Outra limitação, na verdade um ponto fraco das escalas é que apenas uma palavra pode fazer considerável diferença e modificar consideravelmente os resultados. Se ao invés de perguntar qual a nacionalidade que gostaria de estar associado, a pergunta fosse a qual gostaria de servir, ou qual é mais inteligente ou qualquer outro adjetivo, o resultado fatalmente seria outro (THURSTONE, 1931). A redação da escala é então um ponto decisivo sobre a sua validação.
É óbvio que a escala valorativa de cada nacionalidade no teste de Thurstone (1931) é a descrição de um grupo de sujeitos muito mais do que a descrição das nacionalidades. Se o mesmo experimento fosse realizado na Itália ou na Rússia os resultados radicalmente diferentes. Então que fique claro, as escalas não mensuram objetos, mensuram as pessoas (THURSTONE, 1931). Através dela é possível mensurar similaridades ou diferenças culturais. Se os testes forem repetidos em dezenas de países e os resultados forem parecidos entre alguns destes, é possível concluir que essas pessoas se aproximam no aspecto investigado.
Uma das questões mais frequentes sobre a mensuração por escalas é de que não é possível através de números mensurar uma personalidade complexa. Isso é verdade, tanto para investigações por escalas como para qualquer outra forma de mensuração existente, em verdade nenhum método é capaz de extrair com fidedignidade a complexa personalidade humana (THURSTONE, 1931). É importante saber que a mensuração de qualquer objeto descreve apenas o atributo mensurado. Esta é uma característica universal das mensurações. Quando a altura da mesa é medida, a mesa não foi descrita por inteiro, apenas o atributo em questão. Similarmente, a mensuração de atitude apenas mensura a atitude, além do mais, só podem ser medidas as características que podem ser classificadas em termos de ser 'maior ou menor que' (THURSTONE, 1931).
Apenas as características que podem ser pensadas em termos de magnitude linear podem ser descritas por mensuração (THURSTONE, 1931). Neste contexto magnitude linear são como peso, altura, volume, temperatura, quantidade de educação, força de se sentir favorável a alguma coisa. Sendo assim, mensurar é alocar um objeto em algum ponto de um continuo abstrato (THURSTONE, 1931).
A atitude em relação a algum objeto pode ser de forte ou fraca intensidade. A atitude positiva e negativa então constituem um linear contínuo com um ponto ou zona neutra e outros dois em direções opostas, uma positiva e outra negativa (THURSTONE, 1931).
E possível que o discurso de uma pessoa seja contrário as suas atitudes, porém é mais provável que eles estejam alinhados. Em todo caso a melhor forma de reduzir a incerteza em uma mensuração é aplicá-la a um grande grupo de pessoas. As flutuações dos resultados podem ser atribuídas em parte a algum erro do instrumento de mensuração. Para isolar o erro dele das reais flutuações das atitudes, é necessário calcular o desvio padrão da escala (THURSTONE, 1931).
Deve-se assumir também que uma escala de atitude deve ser unicamente utilizada em situações onde é razoável esperar que as pessoas falem a verdade. Devem ser utilizadas prioritariamente em situações que oferecem um mínimo de pressão sobre a atitude mensurada (THURSTONE, 1931).

Mais vistos