Los buscadores

Ver el tema anterior Ver el tema siguiente Ir abajo

Los buscadores

Mensaje por Ing.Terceros el Jue Mayo 05, 2016 12:17 pm


Ing.Terceros
Admin

Mensajes : 28
Fecha de inscripción : 07/04/2015

Ver perfil de usuario

Volver arriba Ir abajo

Re: Los buscadores

Mensaje por diego.chavez el Vie Mayo 06, 2016 10:26 am

Datamining
La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y de gestión de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de Intereses, de consideraciones de la Teoría de la complejidad computacional, de post-procesamiento de las estructuras descubiertas, de la visualización y de la actualización en línea.
Cultura Google
La cultura empresarial del gigante de Internet no se parece a la de otras compañías, y es una de las claves de su éxito.
Se sabe que Google tiene una cultura empresarial propia basada en elementos que no son los típicos de una empresa de estas dimensiones.
Basta con echar un vistazo a las instalaciones de la empresa en cualquiera de sus sedes para darse cuenta de que trabajar para este gigante de Internet es una experiencia única.
De hecho, las oficinas de Google se parecen más un rincón lúdico que a un lugar de trabajo.
Y es que, en esta empresa, existen personas cuya única función es mantener la productividad teniendo a los empleados contentos. Una faceta que puede parecer muy controladora pero que ha resultado ser una de las claves principales del éxito de Google.La innovadora cultura empresarial de Google puede enseñarnos como gestionar nuestra empresa para tener éxito. En el blog de Kissmetrics encontramos algunas de las claves del exitoso funcionamiento del gigante de Internet.
Robot de Google
El robot de Google es el robot de rastreo web de Google (en ocasiones, también denominado "araña"). El rastreo es el proceso mediante el cual el robot de Google descubre páginas nuevas y actualizadas y las añade al índice de Google.
Utilizamos una enorme cantidad de ordenadores para obtener (o "rastrear") miles de millones de páginas de la Web. El robot de Google utiliza un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios web que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.
El proceso de rastreo del robot de Google comienza con una lista de URL de páginas web generada a partir de procesos anteriores de rastreo y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que el robot de Google visita cada uno de esos sitios web, detecta enlaces (SRC y HREF) en sus páginas y los añade a la lista de páginas que debe rastrear. Los sitios web nuevos, los cambios en los existentes y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.
Pagerank
PageRank es una marca registrada y patentada por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. Sus propiedades son muy discutidas por los expertos en optimización de motores de búsqueda. El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página. Fue desarrollado por los fundadores de Google, Larry Page (apellido, del cual, recibe el nombre este algoritmo) y Sergey Brin, en la Universidad de Stanford mientras estudiaban el posgrado en ciencias de la computación.
PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto. Google interpreta un enlace de una página A a una página B como un voto, de la página A, para la página B. Pero Google mira más allá del volumen de votos, o enlaces que una página recibe; también analiza la página que emite el voto. Los votos emitidos por las páginas consideradas "importantes", es decir con un PageRank elevado, valen más, y ayudan a hacer a otras páginas "importantes". Por lo tanto, el PageRank de una página refleja la importancia de la misma en Internet.
Deepbot
Googlebot tiene dos versiones, DeepBot y FreshBot. DeepBot investiga profundamente tratando de seguir cualquier enlace de una página, además de poner tal página en el caché, y dejarla disponible para Google. En marzo del 2006, completaba este proceso en casi un mes.
Freshbot
Freshbot investiga la web buscando contenido nuevo. Visita sitios que cambian frecuentemente. Idealmente, el FreshBot visitará la página de un periódico todos los días, mientras que la de una revista cada semana, o cada 15 días. Así, por ejemplo, puede captar noticias que recién hayan ocurrido, sin tener que esperar semanas.
Fuentes
http://www.google.es/bot.html
http://www.google.com/patents?vid=6285999

diego.chavez

Mensajes : 16
Fecha de inscripción : 17/02/2016

Ver perfil de usuario

Volver arriba Ir abajo

Re: Los buscadores

Mensaje por Hernan.Cortez el Vie Mayo 06, 2016 12:12 pm

TECNOGUL

AdWords y AdSense
Google Adwords: Es la plataforma publicitaria para anunciantes. Permite a las marcas, empresas, crear anuncios o banners dirigidos hacia un sitio web que aparecerán en las páginas de resultados de búsqueda de Google relevantes o hacia una presencia en redes sociales.

Google AdSense: Es la plataforma de publicidad en la que publican anuncios de Google AdWords en sitios web de particulares. De este modo, Google paga a los editores web por los anuncios que publican en su sitio en función de los clics que los usuarios efectúan en anuncios o de las impresiones de anuncios, según el tipo de anuncio.

Diferencia entre AdWords y AdSense
Sencillo, Adwords es para marcas y empresas que se anuncian en internet, Adsense, es para medios que colocan esos anuncios. Google sirve como intermediario para colocar estos anuncios y recibe un margen de la transacción, como en el siguiente ejemplo:



Data mining
Data Mining, la extracción de información oculta y predecible de grandes bases de datos, es una poderosa tecnología nueva con gran potencial para ayudar a las compañías a concentrarse en la información más importante de sus Bases de Información (Data Warehouse). Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en los negocios tomar decisiones proactivas y conducidas por un conocimiento acabado de la información (knowledge-driven).
La tarea de minería de datos real es el análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (análisis clúster), registros poco usuales (la detección de anomalías) y dependencias (minería por reglas de asociación). Esto generalmente implica el uso de técnicas de bases de datos como los índices espaciales. Estos patrones pueden entonces ser vistos como una especie de resumen de los datos de entrada, y pueden ser utilizados en el análisis adicional o, por ejemplo, en la máquina de aprendizaje yanálisis predictivo. Por ejemplo, el paso de minería de datos podría identificar varios grupos en los datos, que luego pueden ser utilizados para obtener resultados más precisos de predicción por un sistema de soporte de decisiones.

Cultura google
“La gente que la conforma es lo que verdaderamente hace que Google sea el tipo de empresa que es. Contratamos personas inteligentes y decididas, y valoramos el talento más que la experiencia. Aunque los empleados de Google comparten objetivos y visiones comunes en la empresa, nos relacionamos con todo tipo de gente y hablamos cientos de idiomas, lo cual refleja el público internacional al cual brindamos servicios. Cuando no están trabajando, los empleados de Google se ocupan de sus intereses, que van desde ciclismo a apicultura y de frisbee a foxtrot.

Buscamos mantener la cultura abierta que generalmente se asocia a los comienzos, en los cuales todos están dispuestos a contribuir y se sienten cómodos al compartir ideas y opiniones. En nuestras reuniones grupales semanales ("TGIF"), sin mencionar los correos electrónicos o en el café, los empleados de Google realizan preguntas directamente a Larry, Sergey y otros ejecutivos acerca de cualquier problema de la empresa. Nuestras oficinas y café están diseñados para fomentar las interacciones entre los empleados de Google dentro de cada equipo y entre todos ellos. De ese modo se da lugar para conversar sobre el trabajo y también para jugar.” –google

Page Rank
Es un valor numérico (del 0 al 10) que representa la importancia de una página en la web. Google entiende que cuando un sitio enlaza a otro sitio, es como si se emitiera un voto. Cuantos más votos (enlaces) son emitidos para un sitio, el buscador entiende que debe ser más importante. Asimismo, la importancia de la página que haya emitido el voto determina la importancia de la votación en sí. Es decir Google calcula la importancia de la web de donde vino el voto. Y esos datos son los importantes a la hora de que el PageRank de una página se calcula.

Es la forma en que Google determina la importancia de una página. Y es importante porque es uno de los factores que determinan el ranking en los resultados de una búsqueda en Google. No es el único factor que Google utiliza para clasificar las páginas, pero es importante.

Fundación Jala
Es una organización sin fines de lucro que busca elevar el nivel tecnológico de nuestro país mediante la formación integral y especializada, a través de diversos programas académicos orientados a las ciencias de la computación y tecnología de punta en general. La Fundación Jala tiene su sede en la ciudad de Cochabamba, Bolivia.



Sitio web: http://www.fundacion-jala.org

Fuentes
https://support.google.com/adsense/answer/76231?hl=es
http://www.gestiopolis.com/
www.calcularpagerank.com/
https://www.google.com/intl/es-419/about/company/facts/culture/


Integrantes:
• Vanesa Aguilar
• Hernán Cortez
• Kenny Zurita
• Israel Estrada

Hernan.Cortez

Mensajes : 9
Fecha de inscripción : 18/02/2016

Ver perfil de usuario

Volver arriba Ir abajo

Re: Los buscadores

Mensaje por Mauricio Calle Callisaya el Vie Mayo 06, 2016 2:30 pm

¿Qué es Data Mining?

Data Mining (minería de datos) es el proceso de extracción de información significativa de grandes bases de datos, información que revela inteligencia del negocio, a través de factores ocultos, tendencias y correlaciones para permitir al usuario realizar predicciones que resuelven problemas del negocio proporcionando una ventaja competitiva. Las herramientas de Data Mining predicen las nuevas perspectivas y pronostican la situación futura de la empresa, esto ayuda a los mismos a tomar decisiones de negocios proactivamente.




Cultura Google

La cultura de google es atípica, es básicamente tecnocrática, pues los individuos progresan según la calidad de sus ideas y por su saber tecnológico. Google también trata de brindar mucha estimulación intelectual, la que, para una empresa que se funda en la tecnología puede ser la oportunidad para aprender de los mejores. Si una empresa realmente adoptara la idea de que las personas son su principal activo en lugar de solo declamaría, las trataría más o menos como lo hace google.

¿Qué es el PageRank?

Simplificando mucho: es un sistema de ranking desarrollado por Google para medir la "Autoridad" de una página web, basándose en la cantidad y "calidad" de los enlaces que apuntan hacia ella.

Aunque la descripción completa es bastante más compleja, en realidad no necesitas saber mucho más, pero sí es conveniente conocer otros detalles importantes.

Robot de Google

GoogleBot es el robot de búsqueda usado por la empresa Google que colecciona documentos desde la web con el fin de construir una base de datos para el motor de búsqueda Google.


Integrantes:
-Danny Montaño
-Marcelo verastegui
-Gary murga
-Mauricio Calle
Twisted Evil ................................

Mauricio Calle Callisaya

Mensajes : 20
Fecha de inscripción : 09/04/2015

Ver perfil de usuario

Volver arriba Ir abajo

Re: Los buscadores

Mensaje por Gustavo_Conde el Vie Mayo 06, 2016 3:00 pm

PATITOSBOYS

El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.

Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Vea más diferencias entre datos, información y conocimiento.
Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso común a todos ellos se suele componer de cuatro etapas principales:

*  Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.

* Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.

*  Determinación del modelo. Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.

*  Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

Cultura google
CLAVE DE SU EXITO
Cada empleado de Google esta encantado de trabajar allí, la cultura organización es la clave ya que no se parece a ninguna de cualquier empresa a nivel mundial, empezando desde sus instalaciones, comenzando desde allí trabajar en esa organización seria un lujo, ya que su entorno se parece a un entorno mas de recreación que de trabajo.
La innovadora cultura empresarial de Google puede enseñarnos como gestionar nuestra propia empresa, para Google mantener a sus empleados a gusto le genera mas productividad por parte de ellos.
Trabajar en Google es una oportunidad única y se les da a los mejores estudiantes que se presenten allí, todos los días llegan muchísimas solicitudes de trabajo en lo cual Google revisa cada una de ellas haciendo así su selección de los mejores para su equipo a nivel mundial
EN DEFINITIVA
La cultura organizacional de Google es una de las razones del gran éxito de la compañía basados en unos criterios que los empleados contentos tendrán una mayor productividad
CULTURA ORGANIZACIONAL
Podemos ver cada día las empresa quieren mejorar la cultura de su organización, un muy buen ejemplo seria la organización Google, desde que se creo en 1998 su crecimiento ha sido enorme, hoy en día cuenta con mas de 15.000 empleados y mas de 40 oficinas en todo el mundo.

Robot de Google

El robot de Google es el robot de rastreo web de Google (en ocasiones, también denominado "araña"). El rastreo es el proceso mediante el cual el robot de Google descubre páginas nuevas y actualizadas y las añade al índice de Google.

Utilizamos una enorme cantidad de ordenadores para obtener (o "rastrear") miles de millones de páginas de la Web. El robot de Google utiliza un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios web que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.

El proceso de rastreo del robot de Google comienza con una lista de URL de páginas web generada a partir de procesos anteriores de rastreo y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que el robot de Google visita cada uno de esos sitios web, detecta enlaces (SRC y HREF) en sus páginas y los añade a la lista de páginas que debe rastrear. Los sitios web nuevos, los cambios en los existentes y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google
Qué es un sitemap?
Un sitemap es un archivo en el que se pueden enumerar las páginas de tu sitio web para informar a Google y a otros motores de búsqueda sobre la organización del contenido del mismo. Los rastreadores web de los motores de búsqueda, por ejemplo, el robot de Google, leen este archivo para rastrear el sitio de forma más inteligente.

Además, tu sitemap puede proporcionar valiosos metadatos asociados a las páginas que enumeras en el sitemap. Los metadatos son información sobre una página web, como, por ejemplo, cuándo se ha actualizado la página por última vez, con qué frecuencia se cambia y la importancia de esta en relación con otras URL del sitio web.


¿Qué es el PageRank?
Simplificando mucho: es un sistema de ranking desarrollado por Google para medir la "Autoridad" de una página web, basándose en la cantidad y "calidad" de los enlaces que apuntan hacia ella.

Aunque la descripción completa es bastante más compleja, en realidad no necesitas saber mucho más, pero sí es conveniente conocer otros detalles importantes.

¿Por qué es importante el PageRank?
El Google PageRank (al que llamamos PR para abreviar) es uno de los factores más importantes (aunque no el único) que determinan en qué posición de los resultados saldrá tu página.

Y como ya sabes, cuanto más arriba salgas, más posibilidades tendrás de conseguir visitantes.

La teoría para el cálculo del PR es sencilla: cada enlace se interpreta como un "voto de confianza" hacia una página.

Cuantos más votos , mayor Autoridad y mayor PageRank, lo que facilita un mejor posicionamiento.

Naturalmente esto es una explicación simplificada, porque Google también tiene en cuenta, entre otros factores:

La autoridad del dominio del que proviene el enlace.
La relevancia temática que tiene la página que te enlaza: es decir, si tiene o no que ver con los contenidos que publicas normalmente.
El texto mediante el cual te enlazan ("anchor text")
El lugar que ocupa en enlace en la página: no tiene la misma autoridad un enlace en el contenido del artículo que en el pie de página.
Y otros muchos factores, la mayoría desconocidos y otros más o menos intuidos.

Conceptos importantes del PR


Cuanto mayor sea el PR de la página que enlaza, mejor, siempre que el número de enlaces salientes de dicha página no sea excesivo. ¿Porqué? Porque la Autoridad se "reparte" entre todos los enlaces salientes.

El PageRank se calcula teniendo en cuenta la cantidad y calidad de los enlaces que se reciben, así que no pierdas demasiado tiempo persiguiendo enlaces "fáciles" de dudosa calidad.

Cada página tiene un PageRank propio, es decir que todas y a cada una de tus páginas (si han sido indexadas) tienen un PageRank único asignado.

El PageRank funciona en una escala logarítmica, cada paso cuesta mucho más que el anterior: es mucho más complicado pasar de un PageRank 3 a 4 que de 1 a 3.

Google únicamente tiene en cuenta los enlaces que conoce, los enlaces desde páginas no indexadas ó penalizadas no te serán útiles.

Es mejor calidad que la cantidad: siempre será más beneficioso un enlace desde una página con PR6 que cientos de enlaces desde páginas con PR1.

Un Pagerank alto no garantiza un buen posicionamiento, pero ayuda.

PageRank es una marca registrada y patentada por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. Sus propiedades son muy discutidas por los expertos en optimización de motores de búsqueda. El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página. Fue desarrollado por los fundadores de Google, Larry Page (apellido, del cual, recibe el nombre este algoritmo) y Sergey Brin, en la Universidad de Stanford mientras estudiaban el posgrado en ciencias de la computación.


DeepBot
GoogleBot es el robot de búsqueda usado por la empresa Google que colecciona documentos desde la web con el fin de construir una base de datos para el motor de búsqueda Google.
Googlebot tiene dos versiones, DeepBot y FreshBot.

DeepBot investiga profundamente tratando de seguir cualquier enlace de una página, además de poner tal página en el caché, y dejarla disponible para Google. En marzo del 2006, completaba este proceso en casi un mes.

Freshbot investiga la web buscando contenido nuevo. Visita sitios que cambian frecuentemente. Idealmente, el FreshBot visitará la página de un periódico todos los días, mientras que la de una revista cada semana, o cada 15 días. Así, por ejemplo, puede captar noticias que recién hayan ocurrido, sin tener que esperar semanas.

Fundación Jala
es una organización sin fines de lucro que busca elevar el nivel tecnológico de nuestro país mediante la formación integral y especializada, a través de diversos programas académicos orientados a las ciencias de la computación y tecnología de punta en general. La Fundación Jala tiene su sede en la ciudad de Cochabamba, Bolivia.

INTEGRANTES:
TATIANA MAMANI
GABRIELA VARGAS
JORGE LUIS QUISPE
LUIS CHAVEZ
GUSTAVO CONDE

Gustavo_Conde

Mensajes : 24
Fecha de inscripción : 18/02/2016

Ver perfil de usuario

Volver arriba Ir abajo

Re: Los buscadores

Mensaje por AntonioEncinasMaida el Vie Mayo 06, 2016 4:32 pm

JUVENTUD EMERGENTE

¿Qué es la minería de datos(DATAMINING)?

La minería de datos , o el descubrimiento de conocimiento, es el proceso asistido por ordenador de la excavación a través y analizar enormes conjuntos de datos y luego extraer el significado de los datos. Herramientas de minería de datos predicen comportamientos y tendencias futuras, permitiendo a las empresas a tomar decisiones proactivas, basadas en el conocimiento. Herramientas de minería de datos pueden responder a las preguntas de negocio que tradicionalmente eran demasiado tiempo para resolver. Ellos recorren las bases de datos de patrones ocultos, encontrar información predictiva que los expertos pueden pasar por alto ya que se encuentra fuera de sus expectativas.

La minería de datos deriva su nombre de las similitudes entre la búsqueda de información valiosa en una gran base de datos y la minería una montaña para una veta de mineral valioso. Ambos procesos requieren ya sea tamizado a través de una inmensa cantidad de material, o de forma inteligente de sondeo para encontrar donde reside el valor.

¿Qué puede hacer minería de datos?

Aunque la minería de datos se encuentra todavía en su infancia, las empresas en una amplia gama de industrias - incluyendo venta al por menor, las finanzas, la atención a la salud, el transporte de fabricación y aeroespacial - ya están utilizando herramientas y técnicas de minería de datos para tomar ventaja de los datos históricos. Mediante el uso de las tecnologías de reconocimiento de patrones y técnicas estadísticas y matemáticas para tamizar a través de información almacenadas, minería de datos ayuda a los analistas reconocen importantes hechos, relaciones, tendencias, patrones, excepciones y anomalías que de otra manera podrían pasar desapercibidos.

Para las empresas, la minería de datos se utiliza para descubrir patrones y relaciones en los datos con el fin de ayudar a tomar mejores decisiones de negocio. La minería de datos puede ayudar a las tendencias de ventas al contado, desarrollar campañas de marketing más inteligentes, y predecir con precisión la lealtad del cliente. Los usos específicos de la minería de datos incluyen:

La segmentación del mercado - Identificar las características comunes de los clientes que compran los mismos productos de su compañía.
La pérdida de clientes - predecir qué clientes son propensos a dejar su empresa e ir a un competidor.
La detección del fraude - Identificar cuáles son las transacciones más probable que sea fraudulenta.
El marketing directo - Identificar qué perspectivas deben ser incluidos en una lista de correo para obtener la tasa de respuesta más alta.
Marketing interactivo - Predecir lo que es más probable interesado en ver cada individuo accede a un sitio Web.
Análisis de la cesta - Entender qué productos o servicios son comúnmente comprado juntos; por ejemplo, cerveza y pañales.
El análisis de tendencias - Revelar la diferencia entre un cliente típico de este mes y durar.

Cultura google

La gente que la conforma es lo que verdaderamente hace que Google sea el tipo de empresa que es. Contratamos personas inteligentes y decididas, y valoramos el talento más que la experiencia. Aunque los empleados de Google comparten objetivos y visiones comunes en la empresa, nos relacionamos con todo tipo de gente y hablamos cientos de idiomas, lo cual refleja el público internacional al cual brindamos servicios. Cuando no están trabajando, los empleados de Google se ocupan de sus intereses, que van desde ciclismo a apicultura y de frisbee a foxtrot.

Buscamos mantener la cultura abierta que generalmente se asocia a los comienzos, en los cuales todos están dispuestos a contribuir y se sienten cómodos al compartir ideas y opiniones. En nuestras reuniones grupales semanales ("TGIF"), sin mencionar los correos electrónicos o en el café, los empleados de Google realizan preguntas directamente a Larry, Sergey y otros ejecutivos acerca de cualquier problema de la empresa. Nuestras oficinas y café están diseñados para fomentar las interacciones entre los empleados de Google dentro de cada equipo y entre todos ellos. De ese modo se da lugar para conversar sobre el trabajo y también para jugar.

Robot de Google

El robot de Google es el robot de rastreo web de Google (en ocasiones, también denominado "araña"). El rastreo es el proceso mediante el cual el robot de Google descubre páginas nuevas y actualizadas y las añade al índice de Google.

Utilizamos una enorme cantidad de ordenadores para obtener (o "rastrear") miles de millones de páginas de la Web. El robot de Google utiliza un proceso de rastreo algorítmico: a través de programas informáticos se determinan los sitios web que hay que rastrear, la frecuencia y el número de páginas que hay que explorar en cada uno de ellos.

El proceso de rastreo del robot de Google comienza con una lista de URL de páginas web generada a partir de procesos anteriores de rastreo y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que el robot de Google visita cada uno de esos sitios web, detecta enlaces (SRC y HREF) en sus páginas y los añade a la lista de páginas que debe rastrear. Los sitios web nuevos, los cambios en los existentes y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.

¿Que es PageRank?

PageRank (PR) es un algoritmo patentado por Google que mide la importancia de una página en particular y en relación a otras páginas incluidas en el índice del buscador. Se inventó a finales de los noventa por Larry Page y Sergey Brin. PageRank implementa el concepto de valor de enlace cómo factor de posicionamiento.

PR se aproxima a la probabilidad de que un usuario, haciendo clic al azar a través de Internet, llegue a una página en particular. Una página a la que se acceda más a menudo es seguramente más importante, y tiene un PR mayor. Cada página que enlaza con otra, aumenta su PR. Las páginas con un PR mayor aumentan el PR de la otra página. Si quieres saber más información sobre el algoritmo de PageRank puedes verlo en la Wikipedia. Una herramienta para poder ver el PageRank de los sitios Web es el plugin de Chrome llamado PageRank Status. Cabe mencionar que el valor del PageRank indicado por Google es un valor en caché y normalmente está desfasado.

Los valores de PageRank se actualizan sólo unas pocas veces al año, pero en muchos casos la información que se pública ya no sirve. Por lo tanto, el PR no es una medida de precisión. El mismo Google utiliza valores actualizados para posicionar.

Fundación JALA


Fundación Jala es una organización sin fines de lucro que busca elevar el nivel tecnológico de nuestro país mediante la formación integral y especializada, a través de diversos programas académicos orientados a las ciencias de la computación y tecnología de punta en general. La Fundación Jala tiene su sede en la ciudad de Cochabamba, Bolivia.

DeepBot

Googlebot tiene dos versiones, DeepBot y FreshBot. DeepBot investiga profundamente tratando de seguir cualquier enlace de una página, además de poner tal página en el caché, y dejarla disponible para Google. En marzo del 2006, completaba este proceso en casi un mes.

FreshBot

Freshbot investiga la web buscando contenido nuevo. Visita sitios que cambian frecuentemente. Idealmente, el FreshBot visitará la página de un periódico todos los días, mientras que la de una revista cada semana, o cada 15 días. Así, por ejemplo, puede captar noticias que recién hayan ocurrido, sin tener que esperar semanas.

Comprobación

Para comprobar si GoogleBot ha accedido a nuestro sitio web, deberemos echar un vistazo a los logs de nuestro servidor. En ellos, deberemos observar si hay registros de accesos en los que aparezca 'GoogleBot'. Generalmente aparecerá el nombre del servidor, el cual podrá ser alguno de estos:

SERVIDOR           DIRECCION IP's

crawl1.googlebot.com   216.239.46.20

crawl2.googlebot.com   216.239.46.39

crawl3.googlebot.com   216.239.46.61

crawl4.googlebot.com   216.239.46.82

crawl9.googlebot.com   216.239.46.234

crawler1.googlebot.com 64.68.86.9

crawler2.googlebot.com 64.68.86.55

crawler14.googlebot.com        64.68.82.138
Una vez que Googlebot haya 'rastreado' nuestra página, seguirá los enlaces que en ella encuentre (los HREF y los SRC).

Por lo tanto, si quieres que GoogleBot indexe tu página web, solamente es necesario que algún otro sitio tenga un enlace al tuyo. Si no es así, siempre puedes añadir directamente tu URL desde Google.

INTEGRANTES:
Antonio Encinas
Diego Tapia
Herbert Morales
Andres Teran




AntonioEncinasMaida

Mensajes : 25
Fecha de inscripción : 17/02/2016

Ver perfil de usuario

Volver arriba Ir abajo

Re: Los buscadores

Mensaje por Contenido patrocinado Hoy a las 4:07 pm


Contenido patrocinado


Volver arriba Ir abajo

Ver el tema anterior Ver el tema siguiente Volver arriba

- Temas similares

 
Permisos de este foro:
No puedes responder a temas en este foro.