terça-feira, 20 de dezembro de 2011

A dimensão Hora do Dia no Data Warehouse

Em determinados casos é necessário analisar a hora em que ocorrem determinados factos. Apenas o dia, pela dimensão Data, não é suficiente. Por exemplo no caso de uma venda, para saber a que horas do dia ocorrem mais vendas.
Torna-se assim criar a dimensão Hora do Dia, ou dimensão Tempo, cuja granularidade será o minuto. No inglês seria "Time-of-day" ou só "Time". Em português vou utilizar o termo Hora do Dia.

Assim a dimensão Hora do Dia terá os seguintes campos:


Chave da Hora do Dia - Chave desta dimensão - Tipo VARCHAR(4) - formato HH24MM
  Por exemplo, as 16:20 (16 horas e 20 minutos) terá a chave 1620. As 5:00 terá a chave 0500
  Esta chave permite um fácil conversão já que extraindo a hora no formato 24 e os minuto, temos directamente a chave da dimensão.

Hora - valor da hora de 0 a 23

Minuto - valor do minuto de 0 a 59


Período do dia - Indicação do periodo do dia, por exemplo: "madrugada", "manhã" , "almoço", "tarde", "noite"



Esta dimensão será carregada com 1440 registos correspondentes a todos os minutos do dia (24*60)

terça-feira, 1 de novembro de 2011

Ebooks - Melhores sites para download

Os livros em formato electrónico, os chamados ebooks, são cada vez mais procurados, até porque os aparelhos que permitem a sua leitura (ebook readers) são cada vez mais comuns.

Hoje em dia, além dos leitores de livros electrónicos específicos para esse fim, que possuem uma tecnologia própria de ecrã, o chamado ePaper (electronic paper), que não cansa a vista, sendo muito próxima da leitura em papel, existem muitos outros aparelhos portáteis que permitem a leitura de livros, como os ipad's, tablets, smartphone', entre outros.

Deixo aqui uma lista dos melhores sites para download de ebooks. Caso conheçam outros agradeço que me façam chegar para tentar manter uma lista cada vez mais completa:

Livros maioritariamente em Português
  1. Blog E-books Grátis
  2. ebooks Portugal
  3. eBookCult
  4. Livros Grátis - Ebooks Downloads
  5. eBooksBrasil
Livrarias Internacionais (Português e não só)
  1. Projeto Gutenberg
  2. Free-eBooks.net
  3. Internet Archive
  4. World Library

segunda-feira, 31 de outubro de 2011

Business Intelligence - Revisão de Literatura

No âmbito do meu mestrado em Engenharia Informática escrevi um pequeno artigo sobre Business Intelligence o qual estou agora a partilhar. Trata-se de uma revisão de literatura.


Business Intelligence 
Revisão de Literatura 

Rui Miguel Dias Anastácio (Aluno nº 4282) 
Évora 25 Abril de 2009

1. Introdução

O termo Business Intelligence, ou simplesmente BI, foi introduzido em meados dos anos 90 pelo Gartner Group e refere-se a um conjunto processos e tecnologias utilizadas para recolher, gerir e reportar informação necessária à tomada de decisão (Davenport e Harris, 2007, pág. 3). Considera-se que o BI foi a evolução dos sistemas conhecidos por Executive Information Systems (EIS) e Executive Support Systems (ESS).

Apesar de recente, este termo refere-se a um problema antigo de gestão. Por exemplo, Gilad e Gilad (1986) refere que as organizações “recolhem informação sobre os seus concorrentes desde o inicio do capitalismo. A revolução real está nos esforços em tentar institucionalizar as actividades de inteligência”. É assim provável que todas as organizações tenham algum género de BI implementado.

Tal como foi referido por Turban et al. (2008) “Managers need the right information at the right time and in the right place. This is the mantra for modem approaches to business intelligence. Organizations have to work smart”. Os gestores são cada vez mais pressionados pela competição e também por questões legais e reguladoras (ver Sarbanes-Oxley Acto de 2002) a gerirem cada vez melhor, sendo o BI a ferramenta que poderá facilitar ou agilizar esse trabalho.

O BI pode também ser entendido (Ghoshal e Kim, 1986; Gilad e Gilad, 1986) como um conceito que se refere a uma filosofia de gestão e uma ferramenta que é utilizada com o objectivo de ajudar as organizações a gerir e refinar a informação e a tomar decisões de negócio mais eficazes.

Grandes empresas estão cada vez mais a adoptar estes sistemas e os resultados são significativos. Um dos casos de estudo apresentados por Turban et al. (2008), o caso da Toyota Motor Sales USA, revela um retorno do investimento em BI na ordem de 506 porcento. Um valor bastante acima da média de 102 porcento verificado em 43 outras empresas do grupo Fortune 500, que mesmo assim revela bons resultados.

A implementação de sucesso do BI envolve no entanto um volume de infra-estrutura tecnológica bastante acima daquela requerida pelos sistemas operacionais (10x-100x o volume de dados e largura de banda), sendo geralmente o resultado de um extenso investimento em tecnologia, processos, políticas e competências, segundo Lynn (2003).

Segundo Turban o BI tem quatro componentes principais (Turban et al., 2008, pg. 11):
  • O Armazém de dados (DataWarehouse, DW);
  • Analítica do Negócio (Business Analytics, BA);
  • Gestão da Performance do Negócio (Business Performance Management, BPM);
  • Interface de utilizador.
Considerando que a interface de utilizador é transversal e se pode diluir nas outras componentes, esta não será aprofundada. Apenas as três primeiras componentes serão de seguida apresentadas. Por fim serão apresentadas algumas das principais soluções de BI existentes actualmente no mercado.

2. Data Warehouse

Segundo Santos e Ramos (2006, pag. 62), um Data Warehouse “é repositório construído especificamente para a consolidação da informação da organização num formato válido e consistente, permitindo aos seus utilizadores a análise de dados de uma forma selectiva”. Turban et al. (2008, pág. 39) acrescenta que o objectivo é o suporte à tomada de decisão e que os dados são orientados ao processo, integrados e temporais. De salientar ainda que esses dados podem ter origem externa à organização, sendo recolhidos de diferentes fontes e em diversos formatos.

Sendo que este repositório contém a informação que será utilizada para analisar o negócio, há que responder em primeiro lugar às seguintes questões (Davenport e Harris, 2007, pág. 5-7):
  1. Que dados são necessários? Quais os dados mais valiosos para diferenciação competitiva e performance de negócio?
  2. Onde podemos obter estes dados? Os dados podem existir dentro e fora da organização, em múltiplas bases de dados, sistemas de ficheiros, Internet, etc.
  3. Que quantidade de dados necessitamos?
  4. Como podemos aumentar o valor dos dados?
  5. Que regras e processos são necessários para gerir os dados desde a sua origem até ao seu carregamento no repositório?
As quatro primeiras questões são essencialmente questões de negócio, que serão objecto de análise e irão culminar com o desenho do modelo de dados do Data Warehouse. Apesar de estes sistemas serem geralmente implementados em bases de dados relacionais o modelo conceptual utilizado não é o relacional mas sim o dimensional. Existem ainda outras abordagens tais como extensões ao modelo Entidade Relação (ER), UML, e outros modelos transversais tais como o proposto por Simitsis (2003).

A quinta questão envolve os processos necessários para a extracção, transformação e carregamento dos dados, aquilo que se designa no jargão técnico de ETL (Extraction-Transformation-Loading).


2.1 O Modelo Dimensional

Segundo Caldeira (2008) o “modelo de dados dimensional surge como uma metodologia que procura atingir dois objectivos principais:
  1. Uma fácil interacção com o utilizador final da aplicação;
  2. Um alto desempenho no processamento de queries.”
Para atingir estes objectivos o modelo deve ser de simples compreensão, com poucas relações entre as tabelas, com dados claros e objectivos, sem a preocupação de serem redundantes ou íntegros. Estes últimos são a principal preocupação nos sistemas operacionais.

Como resultado “o modelo dimensional representa-se graficamente na forma de um esquema em estrela ... além de permitir maiores velocidades de exploração de dados do que o modelo de dados relacional, especialmente nas queries que envolvem ligações que envolvem múltiplas tabelas, a sua representação gráfica é facilmente compreensível pelo utilizador.” (Caldeira, 2008).

Este esquema em estrela é constituído por uma tabela central onde são registados os factos (tabela de factos) relativos ao processo de negócio em causa, com ligações a tabelas descritoras chamadas de dimensões.

A tabela de factos é a tabela primária do modelo dimensional onde são guardadas as medidas numéricas sobre a performance do negócio. O termo facto representa uma medida do negócio (Kimbal e Ross, 2002).

As tabelas de dimensão descrevem textualmente o negócio usando atributos constituídos por palavras reais e não por abreviaturas muitas vezes difíceis de entender. São geralmente constituídas por muitos atributos e consideravelmente menos linhas do que as tabelas de factos.

Se tentarmos normalizar o modelo em estrela iremos obter modelos tais como o modelo floco-de-neve. Tirando casos muito particulares, não se aconselha a realização desta normalização pois isso leva-nos no sentido do modelo transaccional, altamente normalizado, e como tal muito mais complexo e difícil de perceber pelo utilizador. Ao seguir nessa direcção estamos a afastar-nos dos objectivos da modelação dimensional.

2.2 ETL (Extract-Transform-Load)

Uma vez definido o modelo de dados torna-se necessário carregar os dados. Acontece que estes encontram-se normalmente dispersos em várias bases de dados, ficheiros, fontes externas, e com diferentes formatos. Assim o processo de ETL inicia-se com as seguintes operações (Moss e Atre, 2003):
  • Reformatação – Os diferentes dados encontram-se em várias fontes com vários formatos e torna-se necessário unificá-los num formato único;
  • Reconciliação – Resolução de inconsistências;
  • Limpeza – Dados errados devem ser limpos do sistema;
  • Carregamento – Dados são publicados no DW.
Segundo Kimbal e Ross (2002) este processo é crucial para o sucesso do Data Warehouse, consumindo facilmente 70% dos recursos necessários para implementação e manutenção do sistema. Segundo os autores a construção de um sistema de ETL deve seguir dois fluxos em paralelo: o fluxo do planeamento e desenho, e o fluxo dos dados. O primeiro engloba os requisitos e as realidades, a arquitectura, a implementação do sistema e testes/produção. O fluxo de dados envolve os passos: extracção, limpeza, conformidade e entrega.

Dada a complexidade desta tarefa a gestão da mesma tem sido motivo de investigação, como é o caso de Vassiliadis et al. (2002) que propõe a utilização de grafos para modelação das actividades ETL.

3. Business Analytics

Analítica é a ciência da análise. Refere-se normalmente à análise de dados. No âmbito no negócio interessa-nos a análise dos dados do negócio, ou seja, o Business Analytics (BA). Uma aplicação analítica recorre geralmente a um data warehouse (embora não seja condição obrigatória) como fonte de informação, e a um conjunto de técnicas, modelos e ferramentas que permitem aos gestores obter o conhecimento necessário de forma a tomarem melhores decisões estratégicas e de negócio.

Segundo Turban et al. (2008) o Business Analitycs pode ser dividido em três categorias:
  • Descoberta de informação e de conhecimento;
  • Suporte á Decisão e Sistemas Inteligentes;
  • Visualização.


3.1 Descoberta de informação e de conhecimento


A descoberta de informação e de conhecimento utiliza um conjunto de técnicas tais como OLAP (Online Analytical Processing), consultas e relatórios Ad Hoc, Data Mining, Web Mining (Abraham, 2003) e motores de pesquisa, para descobrir a informação/conhecimento existente nos dados.

O termo OLAP é geralmente aplicado ao conjunto de actividades realizadas pelos utilizadores em sistemas online relacionadas com a análise dos dados, como a extracção de relatórios, consultas, relatórios e gráficos ad hoc, análises estatísticas ou construção de representações visuais. Na sua essência os produtos OLAP fornecem capacidades de modelação, análise e visualização de grandes volumes de dados. Segundo Turban et al. (2008) existem quatro tipos de OLAP:
  • Multidimensional OLAP (MOLAP) – Quando o OLAP é implementado sobre uma base de dados multidimensional, permitindo a visualização em várias dimensões. Os dados são organizados numa estrutura em forma de cubo, que o utilizador pode manipular;
  • Relational OLAP (ROLAP) - Quando o OLAP é implementado sobre uma base de dados relacional existente. Estas ferramentas extraem dados de bases de dados relacionais, podendo criar vistas multi-dimensionais on-the-fly. São geralmente utilizados em dados com muitos atributos que não são facilmente transformáveis em estruturas em cubo;
  • Database OLAP (DOLAP) e Web OLAP (WOLAP) – Database OLAP refere-se ao Sistema de Gestão de Base de Dados Relacional que é desenhado para alojar as estruturas OLPA e efectuar os respectivos cálculos. Web OLAP refere-se ao sistema OLPA que está acessível via Web Browser;
  • Desktop OLAP - Refere-se a um conjunto de ferramentas simples e de baixo custo, que

3.2 Suporte à Decisão e Sistemas Inteligentes


Enquanto o OLAP se concentra na geração de relatórios e consultas, outras áreas analíticas têm vindo a desenvolver técnicas mais sofisticadas.

O suporte à decisão e sistemas inteligentes englobam um conjunto de tecnologias tais como os Sistemas de Suporte à Decisão (SSD), os Sistemas de Suporte Empresarial e Executivo, sistemas automáticos de suporte à decisão, Web Analytics, análise preditiva, inteligência artificial aplicada (ver Nordlander, 2001), métricas de performance, entre outras, com o objectivo de ajudar, de uma forma cada vez mais inteligente e automática, o processo de tomada de decisão.

Uma destas técnicas que tem tido um crescente interesse é a análise preditiva, realizada através da mineração de dados, que fornece um conjunto de técnicas e modelos tais como árvores de decisão, redes neuronais artificias, algoritmos genéticos, sistemas difusos, redes de Bayes, entre outros (ver Santos e Azevedo, 2005). Esta análise ajuda a determinar o provável resultado futuro de um processo ou determinar a probabilidade futura de um acontecimento, permitindo assim uma tomada de decisão mais inteligente e eficaz.

3.3 Visualização


A visualização permite interagir com os sistemas de uma forma eficaz, e emprega análise visual, Scorecards, Dashboards, realidade virtual 3D, grafos, vídeo, animação, entre outros.

Uma das ferramentas mais utilizadas pelos utilizadores é a folha de cálculo, e em particular o Microsoft Excel. Esta ferramenta, amplamente conhecida dos utilizadores, fornece um ambiente fácil de usar no qual o utilizador pode realizar cálculos matemáticos, estatísticos, geração de relatórios, gráficos, e outras utilizar outras ferramentas de BI. Muitos dos principais fornecedores disponibilizam interfaces para o Excel, permitindo ao utilizador aceder a data warehouses centralizados através de uma ferramenta conhecida.

No entanto a o Excel permite apenas a visualização em 3 dimensões (linha, coluna e folha) não sendo o mais adequado para estruturas complexas. Além disso prevê-se (Davenport e Harris, 2007) que mais de 20 porcento das folhas contêm erros e que até 5 porcento de todas as células calculadas contêm erros.

Muitos dos fornecedores actuais de OLAP disponibilizam ferramentas de visualização em três dimensões, que permitem o utilizador a visualização e manipulação de várias dimensões. Outros sistemas de visualização incluem aplicações GIS (Geographic Information Systems).


4. Business Performance Management (BPM)


A gestão da performance do negócio não é uma área nova. Grande parte das empresas de certa dimensão desenvolveu processos (mapas estatísticos, orçamentos, medidas de negócio, etc.) que dão o feedback da implementação do plano geral.

A integração dos processos, das metodologias, e das métricas usadas na gestão da performance tem sido o objectivo de sistemas tais como Corporate Performance Management (CPM), Enterprise Performance Management (EPM), Strategic Performance Management (SPM) e mais recentemente Business Performance Management (BPM).

Em 2005 o BPM Standards Group (bpmstandardsgroup.org) definiu o BPM como “a framework for organizing, automating, and analyzing business methodologies, metrics, processes, and systems to drive the overall performance of the enterprise. It helps organizations translate a unified set of objectives into plans, monitor execution, and deliver critical insight to improve financial and operational performance.”

Segundo a Business Performance Management Magazine (ver http://bpmmag.net/about) o BPM é “a set of management and analytic processes, supported by technology, that enable businesses to define strategic goals and then measure and manage performance against those goals. Core BPM processes include financial and operational planning, consolidation and reporting, business modeling, analysis, and monitoring of key performance indicators linked to strategy.”

Existe, relativamente ao BI, um foco maior sobre a estratégia e sobre a necessidade de avaliação das medidas adoptadas.

Uma das metodologias largamente conhecidas e utilizadas pelo BPM é o Balanced Scorecard (BSC), desenvolvida pelos professores da Harvard Business School, Robert Kaplan e David Norton (Kaplan e Norton, 1992), e que a designaram como “a set of measures that give top managers a fast but comprehensive view of the business. The balanced scorecard includes financial measures that tell the results of actions already taken. And it complements the financial measures with operational measures on customer satisfaction, internal processes, and the organization’s innovations and improvement activities”.

Segundo os criadores o BSC permite aos gestores olharem para o negócio de quatro perspectivas importantes:
  • Como é que os clientes nos vêem? (perspectiva do cliente)
  • Onde devemos criar excelência? (perspectiva interna)
  • Podemos continuar a melhorar e a criar valor? (perspectiva da inovação e aprendizagem)
  • Como é que olhamos para os shareholders? (perspectiva financeira)
Associada a cada uma destas perspectivas existe um conjunto de medidas críticas para o
negócio.

5. Soluções de BI

Segue-se uma lista das principais soluções de BI disponíveis actualmente no mercado:
  • SAP Business Objects (http://www.sap.com/solutions/sapbusinessobjects) - Enterprise Business Intelligence;
  • IBM Cognos (http://cognos.com) - Enterprise Business Intelligence;
  • Microsoft BI (http://www.microsoft.com/BI/) - Enterprise Business Intelligence;
  • MicroStrategy (http://microstrategy.com) - Dashboards, scorecards e visualização;
  • ParAccel (http://paraccel.com) - Data Warehousing e Aplicações DW;
  • JasperSoft (http://jarspersoft.com) – Enterprise Business Intelligence;
  • TIBCO Spotfire (spotfire.tibco.com) – Analítica e relatórios, dashboards, scorecards, e visualização;
  • QlikView (http://qlikview.com) - Analítica e relatórios;
  • Talend (http://talend.com) – Integração de dados;

6. Conclusão

Sendo a informação um dos principais recursos de qualquer organização, desde cedo que houve a necessidade de analisá-la. Numa fase inicial havia essencialmente relatórios e consultas que ajudavam os gestores a visualizar o estado das operações, mas com o aumento do nível de concorrência entre empresas, com requisitos legais e regulamentais, e com o advento da globalização, foi sendo cada vez mais necessário tornar o processo inteligente.

Surge assim, em meados dos anos 90, a designação de Business Inteligence, no seguimento de sistemas como tais como o Executive Information System ou o Executive Suport System. Podemos no entanto dizer que o objectivo é o mesmo dos primeiros sistemas, ou seja, a recolha, gestão e apresentação da informação necessária à tomada de decisão.

Com o evoluir do conhecimento, e o agregar desse conhecimento, tem sido possível criar sistemas mais inteligentes. Hoje em dia o BI utiliza técnicas tais como o Data Warehouse, Data Mining, Estatística, Simulação, Algoritmos Genéricos, entre muitas outras. Tendencialmente o BI irá cada vez mais tirar partido destas técnicas de forma a melhor ajudar a gerir o presente mas também a prever o futuro, já que essa é uma mais-valia para qualquer negócio.

Referências
  • Abraham, A. (2003), 'Business Intelligence from Web Usage Mining', JIKM 2(4), 375-390.
  • Caldeira, C. P. (2008), Data Warehousing - Conceitos e modelos, Edições Sílabo.
  • Davenport, T. H. e Harris, H. (2007), The Architecture of Business Intelligence, Institute for High Performance Business.
  • Ghoshal, S. e Kim, S. K. (1986), 'Building Effective Intelligence Systems for Competitive Advantage', Sloan Management Review 28, 49-58.
  • Gilad, B. e Gilad, T. (1986), 'SMR: Forum: Business Intelligence - The Quiet Revolution', Sloan Management Review 27, 53-61.
  • Golfarelli, M., Maio, D. e Rizzi, S. (1998), 'The Dimensional Fact Model: A Conceptual Model for Data Warehouses.', Int. J. Cooperative Inf. Syst. 7(2-3), 215-247.
  • Inmon, W. H. (2002), Building the Data Warehouse, Wiley.
  • Kaplan, R. S. e Norton, D. P. (2006), 'The Balanced Scorecard: Translating Strategy into Action', .
  • Kaplan, R. S. e Norton, D. P. (1992), 'The Balanced Scorecard - Measures that Drive Performance', Harvard Business Review.
  • Kimbal, R. e Caserta, J. (2004), The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data, Wiley.
  • Kimball, R. e Ross, M. (2002), The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Wiley.
  • Lynn, D. (2003), 'Business Intelligence, Data Integration, and Analytics: Keep It Simple, Keep It Flexible', Meta Group - Meta Practice.
  • Moss, L. T. e Atre, S. (2003), Business Intelligence Roadmap, Addison-Wesley.
  • Nordlander, T. E. (2001), 'AI Surveying: Artificial Intelligence in Business', Montfort University.
  • Pirttimäki, V., Lönnqvist, A. e Karjaluoto, A. (2006), Measurement of Business Intelligence in a Finnish Telecommunications Company, Vol. 4, Electronic Journal of Knowledge Management.
  • Santos, M. F. e Azevedo, C. (2005), Data Mining - Descoberta de Conhecimento em Bases de Dados, FCA - Editora de Informática Lda.
  • Santos, M. Y. e Ramos, I. (2006), Business Intelligence, FCA.
  • Simitsis, A. (2003), Modeling and managing ETL processes, VLDB PhD Workshop.
  • Turban, E., Sharda, R., Aronson, J. e King, D. (2008), Business Intelligence - A Managerial Approach, Pearson Education Inc.
  • Vassiliadis, P., Simitsis, A. e Skiadopoulos, S. (2002), 'Modeling ETL activities as graphs.', 58, 52-61.



domingo, 30 de outubro de 2011

A dimensão Data no Data Warehouse

A dimensão Data contextualiza um facto no tempo, permitindo dessa forma analisar o processo numa perspectiva temporal. Como o tempo é uma de análise muito importante, que permite, por exemplo, compreender a evolução do negócio ao longo dos meses, saber em que épocas do ano há maior volume de vendas, relacionar o facto de ser feriado com ao aumento do consumo, etc.,  há todo o interesse em definir uma rica em características de forma a proporcionar ao utilizador diversas possibilidades de análise. Deixo então a minha sugestão (neste momento) para a data:

NOME :
Dimensão Data

CAMPOS:
Chave da Data - Chave da tabela Dimensão Data

Geralmente utilizam-se chaves artificiais (*) para as tabelas do data warehouse, independentes das chaves das tabelas dos sistemas operacionais (mais voláteis). Essas chaves são números sequenciais sem qualquer significado especial. Neste caso é comum utilizar uma chave que representa o dia, por exemplo 20110321 (ano 2011, mês 03, dia 21). A grande vantagem está no preenchimento da tabela de factos, no processo de obtenção da Chave da Data. Por exemplo, se tivermos a data de 15 Dez 1982 no sistema operacional, para obter a Chave da Data (chave na data) basta fazer uma conversão de formato, mudando para AAAAMMDD. Se a Chave da Data fosse um simples número sequencial teríamos ter um processo de procura do número correspondente à data a inserir.

(*) o termo inglês para chave artificial é surrogate key, que significa chave substituta, ou seja, a chave que substitui a chave natural.

Data - Data no formato: 23-03-2011  (DD-MM-YYYY)

Descrição Completa da Data - Data no formato: 12 de Janeiro de 2008

Ano - Ano no formato 2011 (AAAA)

Semestre - Valores:  1º Semestre, 2º Semestre

Trimestre - Valores: 1º Trimestre, 2º Trimestre, ..., 4º Trimestre

Estação do Ano - Valores: Primavera, Verão, Outono, Inverno

Época Festiva - indicação da época festiva tal como o Natal, Páscoa, Carnaval, ...

Mês - Valores: 1, 2, ...,  12

Nome do Mês - Valores: Janeiro, Fevereiro, ...

Mês do Ano - Mês e ano no formato:  Janeiro-2011

Semana do Ano - Valores 1, 2, 3,  ...  para a semana do ano

Semana do Mês - Valores 1, 2, 3,  ...  para a semana do mês

Dia da Semana - Valores:   Segunda-feira, Terça-feira, Quarta-feira, Quinta-feira, Sexta-feira, Sábado e Domingo

Número do Dia da Semana - Valores: 1, 2, 3, 4, 5, 6, 7.  Valores numéricos correspondentes a: Domingo, Segunda-feira, Terça-feira, ... Sábado

Dia do Ano - Valores: 1, 2, 3, ..., 365   para o dia do ano

Dia do Mês - Valores: 1, 2, 3, ..., 31   para o dia do mês

Último dia do Mês -Valores:  Último dia do Mês, Não é último dia do Mês

Feriado - Indicação se é dia feriado. Valores: É feriado, Não é Feriado

SQLData - campo tipo DATE com a data. Utilizado como auxiliar.


E esta é a minha proposta actual para a Dimensão Data, com 21 campos. Se tiver novas ideias por favor deixe o seu comentário.

Quanto ao carregamento desta dimensão a minha sugestão é usar o Excel com algumas fórmulas mágicas que poderão fazer quase todo o trabalho :)

sábado, 29 de outubro de 2011

De tudo um pouco ...: Como poupar na conta de energia

De tudo um pouco ...: Como poupar na conta de energia: Com o aumento do IVA para 23% na factura da EDP (ou seja aumento de 17% em relação ao actual escalão de IVA), resolvi pesquisar que medidas...